Está en la página 1de 69

Contenido

3 Variables aleatorias discretas y distribuciones de probabilidad 2


3.1 Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3.2 Distribuciones de probabilidad para variables aleatorias discretas . . . . 6
3.3 Esperanza y varianza de una variable aleatoria discreta . . . . . . . . . 17
3.3.1 Esperanza de una variable aleatoria . . . . . . . . . . . . . . . . 17
3.3.2 Varianza de una variable aleatoria discreta . . . . . . . . . . . . 22
3.4 La distribución uniforme (discreta) . . . . . . . . . . . . . . . . . . . . 29
3.5 La distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.6 La distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.7 La distribución hipergeométrica . . . . . . . . . . . . . . . . . . . . . . 47
3.8 Las distribuciones binomial negativa y geométrica . . . . . . . . . . . . 55
3.9 Uso de Statgraphics para trabajar con distribuciones discretas . . . . . 60
✍ Ejercicios complementarios . . . . . . . . . . . . . . . . . . . . . . . . . . 62

Respuestas a ejercicios impares seleccionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67


CAPÍTULO 3

Variables aleatorias discretas y


distribuciones de probabilidad

Contenido

3.1 Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . 3


3.2 Distribuciones de probabilidad para variables aleatorias
discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3 Esperanza y varianza de una variable aleatoria discreta 17
3.3.1 Esperanza de una variable aleatoria . . . . . . . . . . . . . 17
3.3.2 Varianza de una variable aleatoria discreta . . . . . . . . . 22
3.4 La distribución uniforme (discreta) . . . . . . . . . . . . . 29
3.5 La distribución binomial . . . . . . . . . . . . . . . . . . . 30
3.6 La distribución de Poisson . . . . . . . . . . . . . . . . . . 38
3.7 La distribución hipergeométrica . . . . . . . . . . . . . . . 47
3.8 Las distribuciones binomial negativa y geométrica . . . 55
3.9 Uso de Statgraphics para trabajar con distribuciones
discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
✍ Ejercicios complementarios . . . . . . . . . . . . . . . . . . . 62
3.1 Variables aleatorias 3

☞ Objetivos del capı́tulo


1. Distinguir el concepto de variable aleatoria discreta.
2. Facilitar la comprensión de los conceptos básicos de las distribuciones discretas de
probabilidad.
3. Desarrollar los conceptos de esperanza y varianza de una variable aleatoria discreta.
4. Presentar aplicaciones de algunas distribuciones discretas en casos concretos.

☞ Empleo de la estadı́stica
≪Una empresa informa que el 25% de los contadores tienen empleo en contadurı́a
pública. Suponga que este porcentaje se aplica a un grupo de 15 egresados de uni-
versidades que van a ejercer la profesión de contadurı́a. ¿Cuál es la probabilidad
de que cuando menos tres egresados tengan empleo en contadurı́a pública?≫

3.1 Variables aleatorias


Es conveniente para el trabajo futuro, saber relacionar los resultados de un experimento
con números reales, ya que cuando los resultados de un experimento se pueden asociar
con números reales, son más fáciles de analizar. Desafortunadamente, no todos los
experimentos dan como resultados números reales.

Ejemplo 3.1.1 Suponga que una moneda se lanza dos veces. Entonces, el espacio muestral
Ω correspondiente tendrá como elementos a las siguientes cuatro parejas ordenadas de datos
cualitativos (categóricos):

(C, C), (C, S), (S, C), (S, S),

en donde C significa “cara” y S, “sello”. Estos resultados no son números reales, pero si
cada uno se asocia con el número de caras, podemos asociar un único real a cada resultado.
Por ejemplo,
Al resultado (C, C) se le puede asignar el número 2 (porque hay dos caras).
Al resultado (C, S) se le puede asignar el número 1 (porque hay una cara).
Al resultado (S, C) se le puede asignar el número 1 (porque hay una cara).
Al resultado (S, S) se le puede asignar el número 0 (porque hay cero caras). ◭

Al hecho de asociar los resultados de una espacio muestral de un experimento con


números reales únicos se le llama variable aleatoria. La variable aleatoria en el ejemplo
3.1.1 es “número de caras que pueden resultar al lanzar una moneda dos veces” y se
dice que tiene los tres valores 0, 1, 2.

Definición 3.1.2 Una variable aleatoria X es una regla o función que asigna
un único número real a cada resultado del espacio muestral Ω de un experimento
aleatorio. En sı́mbolos, una variable aleatoria X es una función X : Ω −→ R, siendo
R el conjunto de los números reales.
3.1 Variables aleatorias 4

Las variables aleatorias se simbolizan, generalmente, con las letras mayúsculas X, Y y Z.


Se utilizará su correspondiente letra minúscula (x, y, z en este caso) para designar sus
posibles valores. Ası́, por ejemplo, si X representa a la regla (variable aleatoria) “número
de caras que pueden resultar al lanzar una moneda dos veces”, entonces, sus valores son
x = 1, 2, 3.

En el capı́tulo 1 se hizo la distinción entre dos tipos datos numéricos: los discretos
y los continuos. Esta misma distinción se hace con las variables aleatorias.

Definición 3.1.3 Una variable aleatoria es discreta si y sólo si tiene una


cantidad o finita o (infinita) enumerable de valores.

Recordemos que un conjunto de elementos es enumerable si los elementos que lo integran


pueden establecer una correspondencia biunı́voca uno a uno con el conjunto de los enteros positivos.
En este contexto, los conjuntos enumerables son infinitos.

Ejemplo 3.1.4 (Ejemplos de variables aleatorias discretas) La tabla 3.1 muestra ejem-
plos de variables aleatorias discretas. En ella aparece un experimento, la correspondiente
variable aleatoria X y sus posibles valores x.

Experimento Variable aleatoria X Valores x


1. Lanzar tres monedas Número de sellos 0, 1, 2, 3
2. Sacar dos fichas, sin reemplazo, de Número de fichas
una caja con 4 fichas rojas y 3 negras rojas 0, 1, 2
3. Lanzar dos dados Suma de los números
de las caras 2, 3, . . . , 12
4. Clientes que llegan a un mostrador Número de clientes 0, 1, 2, . . .
5. Llamar a cinco clientes Cantidad de clientes 0, 1, 2, 3, 4, 5
que hacen pedido
6. Revisar un embarque de 50 radios Cantidad de radios 0, 1, 2, . . ., 50
defectuosos
7. Funcionamiento de un restaurante Sexo del cliente 0 si es hombre;
durante un dı́a 1 si es mujer
8. Lanzar un dado Número de la cara 1, 2, 3, 4, 5, 6

Tabla 3.1: Ejemplos de variables aleatorias discretas ◭

Ahora, presentamos el concepto de una variable aleatoria continua.

Definición 3.1.5 Una variable aleatoria es continua si y sólo si tiene una canti-
dad infinita no enumerable de valores
3.1 Variables aleatorias 5

Ejemplo 3.1.6 (Ejemplos de variables aleatorias continuas) La tabla 3.2 muestra ejem-
plos de variables aleatorias continuas. En ella aparece un experimento, la correspondiente
variable aleatoria X y sus posibles valores x.

Experimento Variable aleatoria X Valores x


1. Medir el tiempo en que apa-
rece una letra en la pantalla Tiempo que demora en
del computador aparecer la letra A x>0
2. Escoger una serpiente al azar Longitud de una serpiente x>0
3. Atención al público de un Tiempo, entre llegadas de
banco clientes x≥0
4. Llenar una lata de bebida
(máx = 12,1 onzas) Cantidad de onzas 0 ≤ x ≤ 12, 1
5. Proyecto para construir una Porcentaje terminado del
nueva biblioteca proyectado en seis meses 0 ≤ x ≤ 100
6. Ensayar un nuevo proceso Temperatura en que se lleva a
quı́mico cabo la reacción deseada 150 ≤ x ≤ 212
(min 150◦ F; máx 212◦ F)

Tabla 3.2: Ejemplos de variables aleatorias continuas ◭

✍ Ejercicios de la sección 3.1


1. Identifique las siguientes variables aleatorias en discretas o continuas:

(a) El número de transistores defectuosos en un lote de 1000 transistores.


(b) El número de robos ocurridos en un almacén en determinado perı́odo de tiempo.
(c) El tiempo requerido por un bus de una ruta determinada para realizar el trayecto
Centro-Universidad.
(d) El número de pólizas de seguros vendidos en un determinado mes por un agente de
seguros.
(e) El tiempo de vida de un bombillo.
(f) El punto de fatiga, en kg por cm2 , de un cable de acero de 1,5 cm de diámetro.
(g) El tiempo que dura un semáforo, de una determinada esquina en la Ciudad, en cambiar
de rojo a verde.
(h) La cantidad de gasolina consumida por un vehı́culo en un trayecto de 50 km.

2. Se determinará el número de computadores en uso, tanto en una oficina con cinco com-
putadores, como en una con tres. Dé los posibles valores para cada una de las siguientes
variables aleatorias.
(a) X = número total de computadores en uso.
(b) Y = la diferencia entre los números de computadores en uso de las oficinas 1 y 2.
(c) Z = número máximo de computadores en uso en cada una de las oficinas.
(d) W = número de oficinas que tienen exactamente dos computadores en uso.
3.2 Distribuciones de probabilidad para variables aleatorias discretas 6

3. Un embarque de cinco máquinas de coser contiene dos que están defectuosas. Si un


almacén de electrodomésticos recibe tres de estas máquinas al azar, enumere los elementos
del espacio muestral Ω con las letras B y D para “buena” y “defectuosa”, respectivamente.
Luego a cada elemento de Ω asigne un valor x de la variable aleatoria X que representa
el número de máquinas de coser defectuosas que el almacén compra.
4. Se lanza una moneda hasta que se obtienen tres caras. Enumere sólo aquellos elementos
del espacio muestral Ω que requieren cinco o menos lanzamientos.
5. Un experimento consiste en la preparación de una comida y se registra el tiempo que tarda
en hacer esto.
(a) Defina una variable aleatoria que represente el tiempo, en minutos, requerido para
preparar la comida.
(b) ¿Qué valores puede asumir la variable aleatoria?
(c) ¿Es discreta o continua esta variable aleatoria?
6. Tres personas tienen entrevistas programadas para empleo durante vacaciones en cierta
empresa. En cada caso, el resultado de la entrevista será que les ofrezcan un empleo
o no. Los resultados experimentales se definen en función de los resultados de las tres
entrevistas.
(a) Haga una lista de los resultados experimentales.
(b) Defina una variable aleatoria que represente la cantidad de ofertas hechas. ¿Es una
variable aleatoria discreta o continua?
(c) Indique el valor de la variable aleatoria para cada uno de los resultados experimentales.

3.2 Distribuciones de probabilidad para variables aleato-


rias discretas
Probabilidad de que una variable aleatoria discreta tome cierto valor
Una variable aleatoria discreta toma cada uno de sus valores con una cierta probabilidad.

Ejemplo 3.2.1 Supóngase que se lanza una moneda dos veces y sea X la variable aleatoria
que representa al “número de caras que resultan”. Hallar la probabilidad de que X tome el
valor (a) 0, (b) 1 y (c) 2.
SOLUCION:
Debido a que el espacio muestral correspondiente está dado por

Ω = (C, C), (C, S), (S, C), (S, S) ,

entonces, realmente, los posibles valores de X son 0, 1 y 2 porque


   
X (C, C) = 2, X (C, S) = 1, X (S, C) = 1, X (S, S) = 0.

Esta información también se puede resumir como se muestra en la tabla de la figura 3.1.
Nos piden calcular1 P(X = 0), P(X = 1) y P(X = 2). Con base en lo anterior, obtenemos
1
P(X = x) se lee “la probabilidad de que la variable aleatoria X tome el valor x”. Por ejemplo,
P(X = 0) significa la probabilidad de que el valor resultante de X sea 0.
3.2 Distribuciones de probabilidad para variables aleatorias discretas 7

Evento muestral (S, S) (C, S) (S, C) (C, C)


Valores de X 0 1 1 2

Fig. 3.1: Valores de una variable aleatoria para el lanzamiento de dos monedas

 1
P(X = 0) = P (S, S) = .
4
   1 1 1
P(X = 1) = P (C, S) o (S, C) = P (C, S) + P (S, C) = + = .
4 4 2
 1
P(X = 2) = P (C, C) = . ◭
4

Función de probabilidad y su representación gráfica


La distribución de probabilidad de una variable aleatoria describe cómo se distribuyen
las probabilidades de los diferentes valores de la variable aleatoria.

Ejemplo 3.2.2 Consideremos nuevamente el lanzamiento de dos monedas y X la variable


aleatoria definida como en el ejemplo 3.2.1. Entonces, teniendo en cuenta las probabilidades
calculadas en ese ejemplo, la distribución de probabilidad de X se puede visualizar a través de
la llamada tabla de distribución de probabilidades (o tabla de probabilidades)
que se muestra en la tabla 3.3 (Recuerde que x interpreta a los valores de X).

x 0 1 2
1 1 1
P(X = x) 4 2 4

Tabla 3.3: Distribución de probabilidad del ejemplo 3.2.2 ◭

Para una variable aleatoria discreta X, las probabilidades de que X tome cada uno de
sus valores generalmente se modelan también a través de la llamada función de proba-
bilidad, que representaremos por f. Esta función define la probabilidad de cada valor de
la variable aleatoria. Por esta razón, introducimos la siguiente

Definición 3.2.3 Sea X una variable aleatoria discreta definida sobre un espacio
muestral Ω y supongamos que X toma los valores x1, x2, . . . (finito o infinito enumer-
able). Decimos que una función f : R −→ [0, 1] es una función de probabilidad
de X si
P(X = xk), para todo valor xk de X;
f(xk) =
0, de otra forma.
Se puede verificar que f cumple las dos siguientes condiciones:
(a) f(xk ) ≥ 0 para todo valor xk de X.
P
(b) f(xk ) = 1.
k
3.2 Distribuciones de probabilidad para variables aleatorias discretas 8

Ejemplo 3.2.4 Consideremos otra vez el lanzamiento de dos monedas y X la variable aleato-
ria definida como en el ejemplo 3.2.1. Sea f : R −→ [0, 1] definida por f(x) = P(X = x), en
donde x es un posible valor de X, es decir, f se define ası́:
1 1 1
f(0) = P(X = 0) = , f(1) = P(X = 1) = , f(2) = P(X = 2) = .
4 2 4
Una descripción equivalente es
 1

 4, si x = 0 o x = 2;



1
f(x) = 2, si x = 1;





0, en otros casos.

Podemos verificar que f satisface las dos condiciones mencionadas en la observación de la


definición 3.2.3. En este ejemplo, f(1) = 1/2 se interpreta de la siguiente manera: de un
gran número de veces que lancemos dos monedas, el 50% de las veces saldrá 1 cara. De
manera similar podemos interpretar cualquier valor de f para un valor determinado de X en
una función de probabilidad. ◭

Ejemplo 3.2.5 Se sabe que en un grupo de cuatro componentes hay dos que tienen un
defecto. Una inspectora los prueba de uno en uno hasta encontrar las dos piezas defectuosas.
Una vez que las localiza interrumpe las pruebas, pero prueba la segunda pieza defectuosa
por seguridad. Si X es el número de pruebas en la que se detecta la segunda pieza defectuosa,
determine la función de probabilidad de X.
SOLUCION:
Sea f la función de probabilidad de X. Debido a que los posibles valores de X son 2, 3 ó 4,
entonces,
2 1 1
f(2) = P(X = 2) = · = ;
4 3 6
2 2 1 2 2 1 1
f(3) = P(X = 3) = · · + · · = ;
4 3 2 4 3 2 3
2 1 2 1 1
f(4) = P(X = 4) = · · · ·3 = .
4 3 2 1 2
Observemos que f satisface las dos condiciones mencionadas en la observación de la definición
3.2.3. ◭

Ejemplo 3.2.6 Para verificar la exactitud de sus estados financieros, las empresas a menudo
emplean auditores que verifiquen sus ingresos. Los empleados de la empresa se equivocan
al registrar los ingresos 5% de las veces. Suponga que un auditor revisa aleatoriamente
tres ingresos. Determine la función de probabilidad del número de errores detectado por el
auditor.
SOLUCION:
Para i = 1, 2, 3, sea Mi el evento que representa al hecho de que el auditor detectó un error
en el ingreso i. De igual manera, sea Bi el evento que representa al hecho de que el auditor
no detectó un error en un ingreso i. De los datos del problema, P(Mi ) = 0, 05. Por tanto,
P(Bi ) = 1 − P(Mi ) = 0, 95. Ahora, sean X la variable aleatoria que representa al número de
errores detectado por el auditor y f su correspondiente función de probabilidad. Tenemos
que Como X puede tomar los valores 0, 1, 2 ó 3, entonces (utilizaremos la independencia de
3.2 Distribuciones de probabilidad para variables aleatorias discretas 9

los eventos Mi , de los Bi y la de los Mi con los Bi ),

f(0) = P(X = 0) = P(B1 B2 B3 ) = P(B1 ) P(B2 ) P(B3 ) = (0, 95)3 = 0, 857375;


f(1) = P(X = 1) = P(B1 B2 M3 ó B1 M2 B3 ó M1 B2 B3 ) = = 3(0, 05)(0, 95)2 = 0, 135375;
f(2) = P(X = 2) = P(B1 M2 M3 ó M1 B2 M3 ó M1 M2 B3 ) = = 3(0, 05)2 (0, 95) = 0, 007125;
f(3) = P(X = 3) = P(M1 M2 M3 ) = (0, 05)3 = 0, 000125.

Observemos que f satisface las dos condiciones mencionadas en la observación de la definición


3.2.3. ◭

En muchas ocasiones, es de mucha ayuda el expresar la distribución de probabilidad en


forma gráfica. En realidad, hay dos formas de hacer esta representación gráfica:

1. Cuando la variable aleatoria es discreta, la gráfica de la función de probabilidad


puede construirse usando segmentos de rectas verticales. Los valores de la variable
aleatoria se localizan en el eje horizontal y las probabilidades en el eje vertical,
en cada valor se construye un segmento de recta vertical de altura igual a la
probabilidad de la variable aleatoria (véase el ejemplo 3.2.7). Advierta que la
suma de las longitudes de los segmentos verticales debe ser igual a 1.

Ejemplo 3.2.7 La gráfica de la función de probabilidad del ejemplo 3.2.4 es como


se muestra en la figura 3.3.

Fig. 3.2: Gráfica de la función de probabilidad del ejemplo 3.2.4 ◭

2. En lugar de la representación anterior, con más frecuencia la función de distribución


de probabilidad se representa gráficamente a través del llamado histograma de
probabilidad. Como en el capı́tulo ??, este histograma es un diagrama de
barras, en donde los rectángulos están dibujados de tal forma que sus bases, con
el mismo ancho, están centradas en cada valor x de X, y sus alturas son iguales
a las correspondientes probabilidades dadas por f(x) (véase el ejemplo 3.2.8).
Puesto que cada base tiene un ancho igual a 1, P(X = x) es igual al área del
rectángulo centrado en x.

Ejemplo 3.2.8 El histograma de probabilidad del ejemplo 3.2.4 es como se muestra


en la figura ??.
3.2 Distribuciones de probabilidad para variables aleatorias discretas 10

Fig. 3.3: Histograma de probabilidad del ejemplo 3.2.4 ◭

Función de distribución acumulada y su representación gráfica


Hay muchos problemas en los cuales se desea calcular la probabilidad de que el valor
observado de una variable aleatoria X sea menor o igual a algún número real x. Si
se escribe F(t) = P(X ≤ t) para cada número real t, se dice que F es la función de
distribución acumulada o, simplemente, la función de distribución de X.

Definición 3.2.9 La función de distribución (acumulada) F : R −→ R de


una variable aleatoria discreta X cuya está definida por F(t) = P(X ≤ t), para todo
t real.

Observemos que si X tiene distribución de probabilidad f, entonces,


X
F(t) = f(x), para todo t real
x; x≤t

en donde la suma anterior recorre todos los valores x de X que son menores o iguales que t.

Ejemplo 3.2.10 Consideremos el lanzamiento de dos monedas y X la variable aleatoria


“número de caras que resultan”. En el ejemplo 3.2.4 se ha encontrado que la distribución
de probabilidad f de X está definida por
1 1 1
f(0) = P(X = 0) = , f(1) = P(X = 1) = , f(2) = P(X = 2) = .
4 2 4
Ahora, hallaremos la función de distribución F de X. Para ello, procederemos teniendo en
los dos siguientes pasos:
• Como los posibles valores de X son 0, 1 y 2, primero determinamos F(t) para cada
3.2 Distribuciones de probabilidad para variables aleatorias discretas 11

valor t en el conjunto {0, 1, 2}:


X 1
F(0) = P(X ≤ 0) = f(x) = f(0) = .
4
x; x≤0
X 1 1 3
F(1) = P(X ≤ 1) = f(x) = f(0) + f(1) = + = .
4 2 4
x; x≤1
X 1 1 1
F(2) = P(X ≤ 2) = f(x) = f(0) + f(1) + f(2) = + + = 1.
4 2 4
x; x≤2

• Ahora, determinamos F(t) para cualquier otro número t (distinto de los valores posi-
bles que toma x, es decir, distinto de 0, 1, 2). En este caso, F(t) coincide con F(x),
siendo x el valor más cercano posible de X a la izquierda de t. Por ejemplo,
– Tomemos números menores2 que 0:

F(−0, 5) = P(X ≤ −0, 5) = P(∅) = 0.


F(−10) = P(X ≤ −10) = P(∅) = 0.

Es decir, para todo t < 0, siempre F(t) = 0.


– Tomemos números que se encuentren entre 0 y 1:
1
F(0, 1) = P(X ≤ 0, 1) = P(X ≤ 0) = .
4
1
F(0, 53) = P(X ≤ 0, 53) = P(X ≤ 0) = .
4
1
F(0, 73) = F(0) = .
4
1
F(0, 98) = F(0) = .
4

Es decir, para todo 0 < t < 1, siempre F(t) = F(0) = 14 .


– Ahora, tomemos números que se encuentren entre 1 y 2:
3
F(1, 32) = P(X ≤ 1, 32) = P(X ≤ 1) = F(1) = .
4
3
F(1, 556) = F(1) = .
4
3
F(1, 91) = F(1) = .
4

Es decir, para todo 1 < t < 2, siempre F(t) = F(1) = 43 .


– Finalmente, tomemos números que sean mayores que 2:

F(3, 84) = F(2) = 1, F(45) = F(2) = 1.

Es decir, para todo t > 2, siempre F(t) = F(2) = 1.


2
Obsérvese que los valores de X no son negativos y, por esta razón, es imposible que X tome un
valor negativo.
3.2 Distribuciones de probabilidad para variables aleatorias discretas 12

Teniendo en cuenta las conclusiones formuladas en los dos pasos anteriores, podemos afirmar
que la función de distribución acumulada está dada por


 0, si t < 0;





 14 , si 0 ≤ t < 1;

F(t) =

 3


 4 , si 1 ≤ t < 2;




1, si t ≥ 2.

El gráfico de esta función aparece en la figura 3.4, en la que puede verse que la función de
distribución acumulada crece a saltos hasta que alcanza el valor 1.

Fig. 3.4: Gráfica de la función de distribución acumulada del ejemplo 3.2.10 ◭

Ejemplo 3.2.11 Sea X la variable aleatoria definida como en el ejemplo 3.2.5. Entonces,
la función de distribución acumulada F de X está dada por


 0, si t < 2;





 16 , si 2 ≤ t < 3;

F(t) =

 12 , si 3 ≤ t < 4;







1, si t ≥ 4.

Para encontrar a la función F, hemos utilizado el mismo procedimiento empleado en el


ejemplo 3.2.10. ◭

En general, para variables aleatorias discretas, la función de distribución acumulada


siempre tiene la forma de función escalonada comenzando en 0, hasta 1 (compárese con
la figura 3.4). Esta y otras propiedades se expresan formalmente en el siguiente teorema:
3.2 Distribuciones de probabilidad para variables aleatorias discretas 13

Teorema 3.2.12 Sea X una variable aleatoria discreta con función de distribución
acumulada F. Entonces,

(a) 0 ≤ F(t) ≤ 1, para todo número real t.

(b) Si a y b son dos números reales con la propiedad de que a ≤ b, entonces, debe
cumplirse que F(a) ≤ F(b). Es decir, F es creciente.

En el ejemplo 3.2.10, observemos que F(0) ≤ F(1) ≤ F(2).

Cálculo de f a partir de F
En el ejemplo 3.2.10, la función de distribución acumulada F se ha determinado a partir
de la función de probabilidad f. Es posible invertir este procedimiento y obtener f a partir
de F cuando está disponible esta última función. Esto último se ilustra en el siguiente
ejemplo:

Ejemplo 3.2.13 Sea X una variable aleatoria discreta con valores 0, 1, 2 y 3 y con función
de distribución acumulada F definida por


 0, si t < 0;




 1

 , si 0 ≤ t < 1;
 7



1
3 , si 1 ≤ t < 2;
F(t) =





 3


 4 , si 2 ≤ t < 3;




1, si t ≥ 3,

cuya gráfica está en la figura Si f es la función de probabilidad de X, entonces, calcularemos


f a partir F de la siguiente manera:

f(3) = P(X = 3) = P(X toma valores 0, 1, 2, 3) − P(X toma valores 0, 1, 2)


3 1
= P(X ≤ 3) − P(X ≤ 2) = F(3) − F(2) = 1 − = .
4 4

f(2) = P(X = 2) = P(X toma valores 0, 1, 2) − P(X toma valores 0, 1)


3 1 5
= P(X ≤ 2) − P(X ≤ 1) = F(2) − F(1) = − = .
4 3 12

f(1) = P(X = 1) = P(X toma valores 0, 1) − P(X toma valores 0)


1 1 4
= P(X ≤ 1) − P(X ≤ 0) = F(1) − F(0) = − = .
3 7 21

1
f(0) = 1 − f(1) − f(2) − f(3) = . ◭
7
3.2 Distribuciones de probabilidad para variables aleatorias discretas 14

Cálculo de probabilidades de la forma P(a ≤ X ≤ b) a partir de f o F


Por regla general, la probabilidad de que X se ubique en un intervalo especı́fico se obtiene
fácilmente de la función de distribución acumulada, como se muestra en el siguiente
ejemplo.

Ejemplo 3.2.14 Sean X y F la variable aleatoria y su correspondiente función de dis-


tribución acumulada, definidas como en el ejemplo 3.2.13. Además, sea f la función de
probabilidad de X. Entonces,

P(2 ≤ X ≤ 3) = P(X toma valores 2 ó 3)


= P(X toma valores 0, 1, 2 ó 3) − P(X toma valores 0 ó 1)
1 2
= P(X ≤ 3) − P(X ≤ 1) = F(3) − F(1) = 1 − = .
3 3
2
P(1 < X ≤ 3) = P(2 ≤ X ≤ 3) = .
3
5
P(2 ≤ X < 3) = P(X toma sólo el valor 2) = P(X = 2) = f(2) = .
12
4
P(0 < X < 2) = P(X = 1) = f(1) = .
21

P(1 < X < 2) = P(∅) = 0.

Observemos que P(2 ≤ X ≤ 3) 6= F(3) − F(2). Esto es porque el valor 2 de X está incluido en
2 ≤ X ≤ 3, por lo cual no deseamos restar esta probabilidad. Sin embargo, observemos que
P(1 < X ≤ 3) = F(3) − F(1) porque X = 1 no está incluida en el intervalo 1 < X ≤ 3. ◭

Todas estas observaciones se pueden resumir en el siguiente teorema:

Teorema 3.2.15 Sea X una variable aleatoria discreta con función de distribución
acumulada F. Entonces,

(a) Si a y b son dos números reales con la propiedad de que a ≤ b, entonces, se


tiene que
P(a ≤ X ≤ b) = F(b) − F(a−),

en donde “a−” representa el valor máximo posible de X que sea estrictamente


menor que a.

(b) En particular, si los únicos valores posibles son enteros y a y b son enteros,
entonces,
P(a ≤ X ≤ b) = F(b) − F(a − 1),

(c) Si se toma a = b, entonces, P(X = a) = F(a) − F(a − 1).


3.2 Distribuciones de probabilidad para variables aleatorias discretas 15

✍ Ejercicios de la sección 3.2


7. Determine el valor de k de modo que cada una de las siguientes funciones sea una función
de probabilidad de una variable aleatoria discreta X:
(a) f(x) = k(x3 + 4), para x = 0, 2, 3.
(b) f(x) = k x3 4−x
 4 
, para x = 0, 1, 2.
8. Un casa editorial sabe que 35% de las textos universitarios que se editan se efectúan en
textos de estadı́sticas con 332 páginas, 20% en con 400 páginas y 45% en textos con 450
páginas. Sea X la variable aleatoria que representa al número de páginas del siguiente
texto universitario de estadı́stica que se editará. Calcule la función de probabilidad de X
y represéntela gráficamente a través de un gráfico lineal y un histograma de probabilidad.
9. Una pizzerı́a, que atiende pedidos por correo, tiene cinco lı́neas telefónicas. Sea X la
variable aleatoria que representa al número de lı́neas en uso en un momento especı́fico.
Supongamos que la función de probabilidad f de X está dada en la siguiente tabla:
Valor x de X 0 1 2 3 4 5
f(x) 0,20 0,25 0,10 0,15 0,09 0,21

Calcule la probabilidad de cada uno de los siguientes eventos:


(a) A = “a lo sumo 2 lı́neas están en uso”.
(b) B = “menos de 4 lı́neas están en uso”.
(c) C = “por lo menos 3 lı́neas están en uso”.
(d) D = “entre 2 y 4 (ambos inclusive) lı́neas están en uso”.
(e) E = “entre 2 y 5 (ambos inclusive) lı́neas no están en uso”.
(f) F = “por lo menos 3 lı́neas no están en uso”.
10. La función de probabilidad de la variable aleatoria X que representa al número de imper-
fecciones por 4 metros de un papel especial en rollos continuos de ancho uniforme, está
dada por

x 0 1 2 3 4
f(x) 0,21 0,28 0,10 0,25 0,16

Determine la función de distribución acumulada de X y represéntela gráficamente.


11. Una fabricante de lapiceros tiene un programa de control de calidad que incluye la in-
spección de lapiceros recibidos para revisar que no tengan defectos. Supongamos que, en
cierto dı́a, él recibe lapiceros en lotes de cinco y se seleccionan dos lapiceros de un lote
para inspeccionarlos. Podemos representar los posibles resultados del proceso de selección
por pares. Por ejemplo, el par (3, 4) representa la selección de los lapiceros 3 y 4 para
inspeccionarlos.
(a) Haga una lista de los resultados diferentes.
(b) Supongamos que los lapiceros 3 y 4 son los únicos defectuosos de un lote de cinco y
se van a escoger dos lapiceros al azar. Defina la variable aleatoria X como el número
de de lapiceros defectuosos observado entre los inspeccionados. Encuentre la función
de probabilidad de X.
(c) Encuentre la función de distribución acumulada F de X y represéntela gráficamente.
12. Se sacan tres fichas sucesivamente, sin reemplazo, de una caja que contiene cuatro fichas
blancas y dos rojas. Encuentre la función de probabilidad para el número de fichas rojas.
3.2 Distribuciones de probabilidad para variables aleatorias discretas 16

13. Un almacén de electrodomésticos ofrece a sus clientes diferentes opciones para el pago de
sus cuotas. Para un cliente seleccionado al azar, sea X la variable aleatoria que representa
al número de meses entre pagos sucesivos. Supongamos que la función de distribución
acumulada F de X está dada por


 0, si t < 1,




 0, 39, si 1 ≤ t < 4,

0, 53, si 4 ≤ t < 6,
F(t) =


 0, 69, si 6 ≤ t < 8,


0, 80, si 8 ≤ t < 12,



1, si 12 ≤ t.

(a) Calcule la probabilidad de que el número de meses entre pagos sucesivos es estricta-
mente mayor que 4, pero menor o igual que 12.
(b) Calcule la probabilidad de que el número de meses entre pagos sucesivos es estricta-
mente menor 4 o mayor o igual que 8.
(c) Calcule la función de probabilidad f de X.
(d) Utilice f para calcular la probabilidad de que el número de meses entre pagos sucesivos
que ha hecho un cliente está entre 4 y 8 meses (ambos inclusive).
(e) Utilice nuevamente a f para calcular la probabilidad de que el número de meses entre
pagos sucesivos que ha hecho un cliente sea mayor o igual que 8.

14. Determine la función de probabilidad y la distribución acumulada de la variable aleatoria


X que representa el resultado cuando se lanza un dado. Calcule la probabilidad de que X
sea estrictamente mayor que (a) 0 y (b) -2 pero menor o igual que 2.
15. Un embarque de siete computadores contiene tres defectuosos. Una empresa hace una
compra al azar de tres computadores. Sea X la variable aleatoria que representa al número
de computadores defectuosos que compra la empresa.
(a) Encuentre la función de probabilidad de X y dibuje el histograma de probabilidad
correspondiente.
(b) Encuentre la función de distribución acumulada de X y represéntela gráficamente.
(c) Calcule la probabilidad de que el número de computadores defectuosos que compra
la empresa es 1.
(d) Calcule la probabilidad de que el número de computadores defectuosos que compra
la empresa es estrictamente mayor que 0, pero menor o igual que 2.
16. Se seleccionan tres monedas sin reemplazo de una caja que contiene cuatro de 200 pesos
y dos de 500 pesos. Encuentre la función probabilidad para la variable aleatoria X que
representa al total de dinero que hay en las tres monedas. Represente gráficamente esta
función como un histograma de probabilidad.
17. La aptitud de una persona para ser mensajero puede categorizarse como aceptable (A) o no
aceptable (I). Cierta empresa necesita dos personas como mensajeros, los cuales deberán
seleccionarse y ponerse a prueba independientemente hasta encontrar dos aceptables.
Supongamos que 95% de todas las personas son aceptables. Sea X la variable aleatoria que
representa al número de personas que deben ser probadas. Halle la función de probabilidad
f de X.
3.3 Esperanza y varianza de una variable aleatoria discreta 17

3.3 Esperanza y varianza de una variable aleatoria dis-


creta
3.3.1 Esperanza de una variable aleatoria
Consideremos inicialmente el siguiente ejemplo:

Ejemplo 3.3.1 Suponga que usted está encargado de crear y administrar un puesto de
juego en una feria que tradicionalmente tiene lugar anualmente en una fecha fija. Por expe-
riencia previa, sabe que a la feria sólo asisten los aficionados a las ferias. Su juego debe ser
simple, y como es usted quien lo administra, eficiente. Se decide por un juego que se llama
“dinero en el sombrero”. Entonces, consigue un sombrero elegante y coloca all 5 billetes de
$1.000, 4 de $2.000 y un billete de $5.000.

A cada jugador se le permite meter la mano en el sombrero y sacar un solo billete3 que
gana como resultado del juego.

Suponga que este juego se va a jugar muchas veces durante el dı́a (digamos 100 veces)
y que usted quiere ganar $1.000 en promedio por persona en ingresos netos o utilidades.
Esto es,
precio por jugar − ganancia promedio por jugada = $1.000.
Suponiendo que cada billete, sin importar su denominación, tiene la misma oportunidad de
ser seleccionado, ¿cuánto debe cobrar usted por jugar “dinero en el sombrero”?
SOLUCION:
Sea X la variable aleatoria discreta que representa a la cantidad de dinero que un jugador
podrı́a ganar en una sola jugada. En este caso, X puede tomar los valores $1.000, $2.000
ó $5.000. Como hay 10 billetes en total en el sombrero y cada billete, sin importar su
denominación, tiene la misma oportunidad de ser seleccionado, entonces,
5 4 1
P(X = 1.000) = = 0, 50, P(X = 2.000) = = 0, 40, P(X = 5.000) = = 0, 10.
10 10 10
Para decidir cuánto debe cobrar usted por jugar “dinero en el sombrero” necesitamos calcular
la “ganancia promedio por jugada”. Ahora, como se jug’o n = 100 veces durante el dı́a,
entonces, esperarı́amos que
• n P(X = 1.000) = (100)(0, 50) = 50 veces los jugadores sacarı́an un billete de $1.000
para una pérdida de (50)($1.000) = $50.000 para el dueño de la feria;
• n P(X = 2.000) = (100)(0, 40) = 40 veces los jugadores sacarı́an un billete de $2.000
para una pérdida de (40)($2.000) = $80.000 para el dueño de la feria;
• n P(X = 1.000) = (100)(0, 10) = 10 veces los jugadores sacarı́an un billete de $5.000
para una pérdida de (10)($5.000) = $50.000 para el dueño de la feria;
Como la pérdida total para el dueño de la feria (o las ganancias totales para los jugadores)
es
$50.000 + $80.000 + $50.000 = $180.000
para los 100 jugadores, la pérdida promedio por jugar es

$180.000
= $1.800.
100
3
Si selecciona más de un billete, el jugador no recibe ninguno, un incentivo suficientemente fuerte
para excluir esto como una posibilidad
3.3 Esperanza y varianza de una variable aleatoria discreta 18

Por lo tanto, para tener un promedio de $1.000 de ganancia por cliente, debemos cobrar
$2.800, para el privilegio de sacar un billete del sombrero. Otra manera de considerar la
pérdida promedio para el dueño de la feria por cliente es:
$1.000P(X = 1000) + $2.000P(X = 2.000) + $5.000P(X = 5.000) = $1.800.
Este valor de $1.800, que corresponde a la “ganancia promedio del cliente por jugada” la
llamaremos el valor esperado de X. ◭

Antes de introducir la defeinición de esperanza de una variable aleatoria, recuerde que


una fórmula para calcular el valor de la media poblacional µ es
P
(f · x)
µ = ,
n
donde f es la frecuencia de una dato particular x y n es el tamaño de la población. Esta
fórmula puede reescribirse como
X f 
µ = x· .
n
Como la frecuencia relativa nf “representa” en cierta forma a P(X = x) (la probabilidad
de que ocurra x) y como f(x) = P(X = x) (en donde f es la función de probabilidad de
X), entonces, la media poblacional puede escribirse como
X
µ = (x · f(x)) .
Como consecuencia de estas observaciones, obtenemos la siguiente definición:

Definición 3.3.2 Sea X una variable aleatoria discreta definida sobre un espacio
muestral Ω y supongamos que X toma los valores x1, x2, . . . (finito o infinito). Sea
f la función de probabilidad de X. Entonces, la esperanza ( valor esperado o
media) de X, simbolizada por µ o E(X), se define como
X
µ = E(X) = xk · f(xk).
k

La interpretación del concepto de esperanza se puede dar en términos de frecuencias


relativas a largo plazo. Supongamos que un experimento aleatorio se repite n veces, y
que el evento {X = x} ocurre en f ocasiones. El promedio de los valores que toma la
variable aleatoria sobre las n repeticiones será, entonces, la suma de xf/n sobre todos los
posibles valores de x. Cuando el número de repeticiones tiende a infinito, el coeficiente
f/n tiende a la probabilidad de ocurrencia del evento {X = x}, es decir, a P(X = x).
Por tanto, xf/n tiende a xP(X = x). De este modo, la esperanza puede interpretarse
como el valor promedio que tomarı́a una variable aleatoria sobre un número grande
de repeticiones y representa una medida de localización localizado a lo largo del eje
horizontal que “dará equilibrio” a la distribución de la variable aleatoria. Es importante
recalcar que la esperanza puede no ser un valor que la variable aleatoria pueda asumir
en un ensayo del experimento.4
4
Por ejemplo, E(X) = $1.800 en el ejemplo 3.3.1, aunque los valores posibles de X sean $1.000,
$2.000 ó $5.000.
3.3 Esperanza y varianza de una variable aleatoria discreta 19

Ejemplo 3.3.3 Consideremos el lanzamiento de dos monedas y sea X la variable aleatoria


“número de caras que resultan”. En el ejemplo 3.2.4 se ha encontrado que la distribución
de probabilidad f de X está definida por
1 1 1
f(0) = P(X = 0) = , f(1) = P(X = 1) = , f(2) = P(X = 2) = .
4 2 4
Por consiguiente, la esperanza de X está dada por

E(X) = 0 · f(0) + 1 · f(1) + 2 · f(2)


1 1 1
= 0· + 1· + 2· = 1.
4 2 2
Es decir, cuando el lanzamiento de las monedas se repite un número grande de veces, se
espera que resulte en promedio 1 cara. ◭

Ejemplo 3.3.4 Una planta industrial grande realiza una campaña para promover el uso
compartido del automóvil entre sus empleados. Los datos en la tabla de la figura 3.5 se
registraron entre todos los empleados de la planta para conocer los efectos de la campaña.

Número x Frecuencia
de ocupantes Frecuencia relativa
por automóvil f xf f/n
1 425 425 0,450
2 235 470 0,249
3 205 615 0,217
4 52 208 0,055
5 22 110 0,023
6 6 36 0,006
Total 945 1.864 1

Fig. 3.5: Datos de uso compartido del automóvil


1.864
La media poblacional está dada por µ = 945 = 1, 97.

Ahora escojamos un coche al azar que transporte empleados al trabajo y contemos el número
de ocupantes. Este número representa una variable aleatoria X, que toma los valores 1, 2,
3, 4, 5 y 6 con las probabilidades 0,45, 0,249, 0,217, 0,555, 0,023 y 0,006 respectivamente.
La esperanza de esta variable aleatoria es entonces

E(X) = 1 · f(1) + 2 · f(2) + 3 · f(3) + 4 · f(4) + 5 · f(5) + 6 · f(6)


= (1)(0, 45) + (2)(0, 249) + (3)(0, 217) + (4)(0, 555) + (5)(0, 023) + (6)(0, 006)
= 1, 97.

Observe que esto concuerda con valor calculado anteriormente. ◭

Ejemplo 3.3.5 Una empresa considera dos inversiones posibles. Como aproximación ini-
cial, asigna probabilidades (subjetivas) a cada uno de los siguientes eventos: perder un 20%
por cada dólar invertido, perder un 10%, ni ganar ni perder, ganar un 10% y ganar un 20%.
Sea X el rendimiento por cada dólar invertido en el primer proyecto y Y el rendimiento por
cada dólar invertido en el segundo. Las probabilidades asignadas son
3.3 Esperanza y varianza de una variable aleatoria discreta 20

x -0,20 -0,10 0 +0,10 +0,20


P(X = x) 0,1 0,2 0,4 0,2 0,1

y -0,20 -0,10 0 +0,10 +0,20


P(Y = y) 0,01 0,04 0,10 0,50 0,35

Calcule los rendimientos esperados por cada dólar invertido en cada proyecto. ¿Cuál proyecto
le parece a usted que representa la inversión más atractiva.
SOLUCION:
El proyecto X, de acuerdo con cualquier estándar razonable, parece menos atractivo. Resulta
igualmente posible perder un 20% que ganarlo, o ganar un 10% que perderlo. El proyecto
Y ofrece mayores posibilidades de ganar un 10 o un 20% y relativamente pocas de perder.
Ahora, E(X) = 0 y E(Y) = 0, 114. Por o tanto, el rendimiento esperado de X es (como hemos
anticipado) menor que el rendimiento esperado de Z. ◭

Esperanza de una función


La noción de esperanza no se restringe a la propia variable aleatoria X, también puede
aplicarse a cualquier función h(X) de la misma5 , como se explica en los siguientes dos
ejemplos:

Ejemplo 3.3.6 Un contratista puede tener cierta incertidumbre sobre el tiempo que re-
querirá terminar un contrato. Esta incertidumbre puede representarse mediante una varia-
ble aleatoria cuyos valores posibles son el número de dı́as transcurridos desde el comienzo
hasta la conclusión del trabajo que se ha contratado. Sin embargo, el principal interés del
contratista no es el tiempo necesario sino el costo de cumplir el contrato. Este costo será
una función del tiempo. Luego, para determinar el costo esperado, es necesario expresar la
esperanza como una función de la variable aleatoria “tiempo necesario para la conclusión
del trabajo”.

Ejemplo 3.3.7 Suponga que una librerı́a compra tres ejemplares de un libro a $10.000
para venderlos a $20.000, entendiendo que al terminar el periodo de tres meses, cualquier
ejemplar no vendido se venderá en $3.000. Si X es la variable aleatoria “número de ejemplares
vendidos”, entonces, la utilidad neta es una variable aleatoria h(X) que depende de X y que
está dada por

h(X) = 20.000X + 3.000(3 − X) − 30.000 = 17.000X − 21.000. ◭

El siguiente teorema nos sugiere una forma sencilla de calcular la esperanza de una
función h(X).

5
Es importante enfatizar que toda función h(X) de una variable aleatoria discreta X es también
una variable aleatoria discreta.
3.3 Esperanza y varianza de una variable aleatoria discreta 21

Teorema 3.3.8 Sea X una variable aleatoria discreta definida sobre un espacio
muestral Ω y supongamos que X toma los valores x1, x2, . . . (finito o infinito). Sea f
la función de probabilidad de X. Entonces, la esperanza o media de cualquier
función h(X) de X, simbolizada por E h(X) , se define como
 X
E h(X) = h(xk) · f(xk).
k

La esperanza E h(X) puede entenderse como el valor promedio que tomarı́a h(X) sobre un número
muy grande de repeticiones.

Ejemplo 3.3.9 Si en el ejemplo 3.3.7, la variable X toma los valores 0, 1, 2 y 3 con las
probabilidades 0,1, 0,2, 0,3 y 0,4, respectivamente, entonces, la utilidad esperada es

E h(X) = h(0) · f(0) + h(1) · f(1) + h(2) · f(2) + h(3) · f(3)
= (−21.000)(0, 1) + (−4.000)(0, 2) + (13.000)(0, 3) + (30.000)(0, 4)
= 13.000.

Es decir, sobre un número muy grande de repeticiones, se espera que el comprador tenga
una utilidad de $13.000. ◭

Propiedades de la esperanza
Hemos definido la esperanza de una función h(X) de una variable aleatoria X. La función
lineal h(X) = aX + b, donde a y b son números reales fijos, es de particular interés. En
este caso, E h(X) se calcula fácilmente a partir de E(X).

Teorema 3.3.10 Sean X una variable aleatoria discreta definida sobre un espacio
muestral Ω y a, b números reales fijos. Entonces,

(a) E(aX + b) = aE(X) + b.

(b) E(aX) = aE(X) (si se toma b = 0).

(c) E(b) = b (si se toma a = 0).

Ejemplo 3.3.11 Sea X cualquier variable aleatoria discreta. Si la variable aleatoria 5X + 2


tiene esperanza 1, ¿cuál es la esperanza de X?
SOLUCION:
Por hipótesis, se tiene que E(5X + 2) = 1. Por consiguiente, por el teorema 3.3.10a,

1 = E(5X + 2) = 5 E(X) + 2.

Con lo anterior, 5E(X) = 1 − 2 = −1, o sea, E(X) = − 15 . ◭


3.3 Esperanza y varianza de una variable aleatoria discreta 22

3.3.2 Varianza de una variable aleatoria discreta


Ya que tenemos una manera de medir la localización de la distribución de probabilidad,
la pregunta es: ¿cómo sabremos, preferiblemente con un sólo número, el grado de dis-
persión de la distribución? Si queremos utilizar la esperanza en conjunto con una medida
de dispersión para describir una distribución, entonces, estudiar la distribución alrededor
de la esperanza es un método destacado (pero no único) para considerar la dispersión de
los valores posibles de una varibale aleatoria. Utilizaremos la esperanza como un punto
de referencia.

Primero, debemos observar que este concepto de dispersión requiere alguna medida
de la distancia x − E(X) entre un valor x determinado de la variable aleatoria X y el
valor esperado E(X). Esta distancia serı́a todo lo necesario si todos los valores de la va-
riable aleatoria discreta tuvieran la misma importancia (o igual probabilidad de ocurrir).
Frecuentemente este no es el caso. A menudo algunos valores de la variable aleatoria
tendrán una probabilidad más alta de ocurrir que otros. Entonces, necesitamos alguna
forma de ponderar cada distancia para reflejar sus diferencias en importancia relativa.

Esta lı́nea de razonamiento nos indicarı́a que todo cuanto necesitamos hacer, es medir
la distancia xi − E(X) entre cada valor xi de la variable aleatoria discreta X y el valor
esperado E(X) y ponderar esta distancia por la probabilidad de que P ocurra tal valor ası́:
[xi − E(X)]P(X = xi). Sumando todas estas distancias ponderadas, [xi − E(X)]P(X =
xi), tendremos la medida de dispersión buscada. Nuestra lógica es correcta, pero esta
medida no nos permitirá distinguir entre una distribución de probabilidad y otra porque,
desafortunadamente, X
[xi − E(X)]P(X = xi) = 0
para todas las distribuciones de probabilidad. Es decir, obtenemos siempre el mismo
valor numérico (esto es, 0) sin importar cuál distribución consideramos.

Hay varias maneras de evitar esta dificultad y mantener nuestra idea de un “distancia
ponderanda” para medir la dispersión. Al usar xi − E(X), nuestra medida de “distancia”
fue a veces positiva y otras negativa. Al elevar al cuadrado esa diferencia, [xi − E(X)]2,
conservamos una medida de distancia, pero el valor numérico es siempre positivo. Pode-
mos ponderar nuestra “nueva” medida de distancia por la probabilidad de ocurrencia
de aquel valor de X y, entonces, tenemos una medida de dispersión. Los matemáticos
han utilizado tradicionalmente esta medida y la llaman la varianza de la variable aleatoria.

Antes de introducir el concepto de varianza, recordemos que la varianza poblacional


de una conjunto de datos σ2 está definida por
P
2 f · (x − µ)2
σ = ,
n
donde f es la frecuencia de un dato particular x y n es el tamaño de la población. Esta
fórmula puede reescribirse como
X 
2 2 f
σ = [x − µ] · .
n
3.3 Esperanza y varianza de una variable aleatoria discreta 23

Como la frecuencia relativa nf “representa” en cierta forma a P(X = x) (la probabilidad


de que ocurra x) y como f(x) = P(X = x) (en donde f es la función de probabilidad de
X), entonces, la media poblacional puede escribirse como
X 
σ2 = [x − µ]2 · f(x) .

Como consecuencia de estas observaciones, obtenemos la siguiente definición:

Definición 3.3.12 Sea X una variable aleatoria discreta definida sobre un espacio
muestral Ω y supongamos que X toma los valores x1, x2, . . . (finito o enumerable).
Sean f y µ la función de probabilidad y esperanza de X, respectivamente. Entonces,
la varianza de X, simbolizada por σ2 o V(X), se define como
X
σ2 = V(X) = E (X − µ)2 = (xk − µ)2 · f(xk).


La desviación estándar de X, denotada por σ, se define como la raı́z cuadrada


positiva de la varianza.

Tomar la raı́z cuadrada de la varianza para obtener la desviación estándar proporciona un


valor en las unidades de medidas originales, como señalamos en el capı́tulo ??.

Cuando se conoce la función de probabilidad, la media y la varianza de una variable


aleatoria pueden calcularse aplicando directamente la definición. En algunas aplica-
ciones pr”acticas, desde el punto de vista computacional, es preferible usar una fórmula
alternativa equivalente para calcular la varianza. La equivalencia entre la fórmula alter-
nativa y la definición puede veriricarse algebraicamente.

Teorema 3.3.13 Sea X una variable aleatoria discreta definida sobre un espacio
muestral Ω y supongamos que X toma los valores x1, x2, . . . (finito o enumerable).
Sean f y µ la función de probabilidad y esperanza de X, respectivamente. Entonces, la
varianza de X es la esperanza del cuadrado de X menos el cuadrado de la esperanza
de X. Es decir,
2 X 2
V(X) = E(X2) − E(X) = x2k f(xk) − E(X) .
 

Ejemplo 3.3.14 Consideremos el lanzamiento de dos monedas y sea X la variable aleatoria


“número de caras que resultan”. En el ejemplo 3.2.4 se ha encontrado que la distribución
de probabilidad f de X está definida por
1 1 1
f(0) = P(X = 0) = , f(1) = P(X = 1) = , f(2) = P(X = 2) = .
4 2 4
Además, en el ejemplo 3.3.3, hemos encontrado que la esperanza de X es µ = 1. Por
3.3 Esperanza y varianza de una variable aleatoria discreta 24

consiguiente, según la definición 3.3.12, la varianza de X está dada por

V(X) = (0 − 1)2 · f(0) + (1 − 1)2 · f(1) + (2 − 1)2 · f(2)


1 1 1 1
= 1· + 0· + 1· = .
4 2 4 2
p
Con esto, la desviación estándar de X es σ = 1/2 = 0, 707. La varianza de X pudimos
haberla hallado aplicando el teorema 3.3.13 de la siguiente manera:

E(X2 ) = 02 · f(0) + 12 · f(1) + 22 · f(2)


1 1 1 3
= 0· + 1· + 4· = .
4 2 4 2
Por consiguiente,
2 3 1
V(X) = E(X2 ) − E(X) = − 12 = .


2 2
Ejemplo 3.3.15 Consideremos los datos del uso compartido del automóvil presentados en
el ejemplo 3.3.4 y sea X la variable aleatoria definida en ese mismo ejemplo. Allı́ se encontró
que la esperanza de X es µ = 1, 97. Con esto, la varianza de esta variable aleatoria es

V(X) = (1 − 1, 97)2 · f(1) + (2 − 1, 97)2 · f(2) + (3 − 1, 97)2 · f(3) + (4 − 1, 97)2 · f(4) +


+ (5 − 1, 97)2 · f(5) + (6 − 1, 97)2 · f(6)
= (0, 9409)(0, 45) + (0, 0009)(0, 249) + (1, 0609)(0, 217) + (4, 1209)(0, 555) +
+ (9, 1809)(0, 023) + (16, 2409)(0, 006)
= 1, 197

y, por consiguiente, la desviación estándar de X es σ = 1, 197 = 1, 094. ◭

Ejemplo 3.3.16 En el ejemplo 3.3.5, encuentre la varianza y la desviación estándar de X


y Y e interprete los valores obtenidos.
SOLUCION:
En dicho ejemplo tenemos que E(X) = 0 y E(Y) = 0, 114. Podemos verificar que

V(X) = 0, 012, σX = 0, 110, V(Y) = 0, 006804, σY = 0, 082.

La distribución de X tiene una mayor variabilidad. El grueso de la distribución de Y se


concentra en los valores 0,10 y 0,20, mientras que las probabilidades de X están de algún
modo dispersas entre todos los valores posibles. Con frecuencia se toma a la varianza del
rendimiento como una medida del riesgo, siendo éste mayor cuanto mayor es la varianza.
En este ejemplo, la inversión Y tiene un rendimiento más alto y un riesgo menor. ◭

Varianza de una función


El siguiente teorema nos sugiere una forma sencilla de calcular la varianza de una función
h(X) con X discreta.
3.3 Esperanza y varianza de una variable aleatoria discreta 25

Teorema 3.3.17 Sea X una variable aleatoria discreta definida sobre un espacio
muestral Ω y supongamos que X toma los valores x1, x2, . . . (finito o infinito). Sea
f la función de probabilidad de X. Entonces,
 la varianza de cualquier función
h(X) de X, simbolizada por V h(X) , se define como
 X 2
V h(X) = h(xk) − V h(X) · f(xk).
k

Como antes, la desviación estándar de h(X) es igual a la raı́z cuadrada positiva


de la varianza de h(X).

Ejemplo 3.3.18 Supongamos que, en el ejemplo 3.3.7, la variable X toma los valores 0, 1,
2 y 3 con las probabilidades 0,1, 0,2, 0,3 y 0,4,
 respectivamente. En el ejemplo 3.3.7 hemos
calculado que la utilidad esperada es E h(X) = $13.000, siendo h(X) la utilidad neta. Por
consiguiente, la varianza de h(X) es

V h(X) = [h(0) − 13.000]2 · f(0) + [h(1) − 13.000]2 · f(1) + [h(2) − 13.000]2 · f(2) +


+ [h(3) − 13.000]2 · f(3)


= (−21.000 − 13.000)2 (0, 1) + (−4.000 − 13.000)2 (0, 2) +
+ (13.000 − 13.000)2 (0, 3) + (30.000 − 13.000)2 (0, 4)
= (11, 56 × 108 )(0, 1) + (28, 9 × 107 )(0, 2) + (0)(0, 3) + (28, 9 × 107 )(0, 4)
= 28, 9 × 107 .

La desviación estándar de h(X) es igual a 28, 9 × 107 = $17.000. ◭

Reglas de la varianza
Cuando h(X) es unafunción lineal de la forma h(X) = aX+b, donde a y b son números
reales fijos, V h(X) se calcula fácilmente a partir de V(X).

Teorema 3.3.19 Sean X una variable aleatoria discreta definida sobre un espacio
muestral Ω y a, b números reales fijos. Entonces,

(a) V(aX + b) = a2V(X).

(b) V(aX) = a2V(X) (si se toma b = 0).

(c) V(b) = 0 (si se toma a = 0).

(d) La desviación estándar de aX + b es igual a |a| por la desviación estándar de


la variable X.

Observemos que las partes (a) y (b) dicen que la inclusión de la constante b no afecta la varianza, lo
cual es intuitivo porque la suma (o la resta) de una constante b cambia la ubicación (valor medio),
pero no la dispersión de los datos. Además, la razón para el valor absoluto de a en la parte (d) es
que a puede ser negativa, mientras que la desviación estándar no puede ser negativa.
3.3 Esperanza y varianza de una variable aleatoria discreta 26

La regla de Tchebychev y la regla empı́rica para variables aleatorias


discretas
La regla de Tchebychev y la regla empı́rica, introducidas en el capı́tulo ?? para muestras
y poblaciones, también se aplican a las variables aleatorias.

Teorema 3.3.20 (Regla de Tchebychev y regla empı́rica) Sea X una varia-


ble aleatoria con media µ y varianza σ2 (ambas finitas). Entonces,

1
P(|X − kσ| ≤ µ) ≥ 1 − ,
k2
para cualquier número k > 1. Si X tiene más o menos un histograma de probabilidad
con forma de campana, entonces,

P(|X − σ| ≤ µ) ≈ 0, 68, P(|X − 2σ| ≤ µ) ≈ 0, 95.

Ejemplo 3.3.21 Para la variable aleatoria X de los ejemplos 3.3.5 y 3.3.16, tenemos que
E(X) = 0 y σX = 0, 110. Las verdaderas probabilidades son

P(|X − σ| ≤ µ) = P(|X − 0, 110| ≤ 0)


= P(−0, 110 ≤ X ≤ 0, 110)
= P(Y = −0, 10) + P(Y = 0) + P(Y = 0, 10)
= 0, 80

y
P(|X − 2σ| ≤ µ) = P(|X − 0, 220| ≤ 0) = P(−0, 220 ≤ Y ≤ 0, 220) = 1.
La regla de Tchebychev indica que estas probabilidades deben ser al menos 1 − 1/(12 ) = 0 y
1 − 1/(22 ) = 0, 75, respectivamente. Como de costumbre, las desigualdades son ciertas con
un margen muy grande. En este caso, la aproximación que nos da la regla empı́rica es muy
mediocre, en parte porque X toma un número muy pequeño de valores. Si la empresa hubiese
estimado probabilidades subjetivas para los rendimientos de, digamos, −0, 25, −0, 20, −0, 15,
. . ., 0, 15, 0, 20, 0, 20, lo más probable es que la regla empı́rica hubiese sido una mejor
aproximación, aunque la distribución no tenga una forma de campana. ◭

✍ Ejercicios de la sección 3.3


18. Encuentre la media de la variable aleatoria X que representa al total de las tres monedas
en el ejercicio 16 e interprete su respuesta.
19. Una distribuidora de aparatos electrodomésticos calcula la proporción de estufas nuevas
vendidas que han sido devueltas varias veces para repararles algún defecto durante el
perı́odo de garantı́a. Los resultados se presentan en la siguiente tabla:

Devoluciones 0 1 2 3 4 5
Proporción 0,20 0,30 0,21 0,09 0,06 0,14

(a) Dibujar la función de probabilidad.


(b) Hallar y dibujar la función de distribución acumulada.
3.3 Esperanza y varianza de una variable aleatoria discreta 27

(c) Hallar la media y la varianza del número de devoluciones para reparar defectos de una
estufa durante el perı́odo de garantı́a.

20. La función de probabilidad de la variable aleatoria X que representa al número de imper-


fecciones por 4 metros de un papel especial en rollos continuos de ancho uniforme, está
dada en el ejercicio 10 por

x 0 1 2 3 4
f(x) 0,21 0,28 0,10 0,25 0,16

Encuentre el número promedio de imperfecciones en 4 metros de papel y su desviación


estándar.
21. Un distribuidor de computadores, vende tres modelos diferentes de computadores con
capacidad de 20 GB, 25 GB y 30 GB del disco duro . Sea X la variable aleatoria que
representa a la cantidad de espacio del disco duro de un computador comprado por el
siguiente cliente. Supongamos que X tiene la función de probabilidad f dada por

x 20 25 30
f(x) 0,29 0,31 0,40

(a) Calcule E(X), E(X2 ) y V(X). Interprete E(X).


(b) Si el precio de un computador con capacidad X GB de disco duro es h(X) = 15X − 3,
¿cuál es el precio esperado (interprételo) y la varianza del precio?
(c) ¿Cuál es la varianza del precio h(X) pagado por el cliente?
(d) Suponga que mientras la capacidad nominal de un computador es X, la capacidad
real es g(X) = X2 − X. Calcule la media de la capacidad real e interprétela.

22. El propietario de una compañı́a proveedora de levadura tiene en existencia 120 libras de
un producto que vende a los clientes en lotes de 4 libras. Sea X la variable aleatoria que
representa al número de lotes ordenados por un cliente seleccionado al azar y suponga que
X tiene una función de probabilidad

x 1 2 3 4 5
f(x) 0,18 0,32 0,30 0,12 0,08

(a) Calcule E(X) y V(X). Interprete E(X).


(b) Calcule el número esperado y la varianza de libras sobrantes. (Sugerencia: el número
de libras restantes es una función lineal de X.)

23. Sea X una variable aleatoria discreta que representa al número de personas que fuman de
una muestra de 4 personas escogidas de una población en donde el 25% de las personas
fuman. Supongamos que X tiene función de probabilidad definida por
 
4
f(x) = (0, 25)x (0, 75)4−x , x = 0, 1, 2, 3, 4.
x

Encuentre la media de X e interprete su respuesta.


24. A un empleado de un servicio de fotocopiadora se le paga de acuerdo al número de
fotocopias que saca. Suponga que las probabilidades 1/7, 3/14, 1/14, 3/14, 2/7, 1/14
son las de que el empleado reciba $1.500, $2.000, $2.500, $3.000, $3.500 y $4.000,
respectivamente, entre 8:00 a.m. y 9:00 a.m. en cualquier lunes. Encuentre la media de
las ganancias del empleado e interprete su respuesta.
3.3 Esperanza y varianza de una variable aleatoria discreta 28

25. Un determinada empresa compra varios computadores último modelo al final de cada año.
El número exacto depende de la frecuencia de reparaciones en el año anterior. Suponga
que X, el número de computadores que se compran cada año, tiene la siguiente función
de probabilidad:
x 0 1 2 3
f(x) 1/4 3/16 1/4 5/16
Si el costo del modelo que se desea permanece fijo a $2.830.451 a lo largo de este año y
se obtiene un descuento de $100.000X2 en cualquier compra, ¿cuánto espera gastar esta
empresa en nuevos computadores al final de este año?
26. Suponga que las probabilidades de 0,1; 0,3; 0,4 y 0,2 son las de que 0, 1, 2 ó 3 personas
compren cierto artı́culo que está en oferta en un pequeño almacén y en cierto dı́a dado.
Encuentre la media y la varianza del número de personas que compran el artı́culo en oferta.
27. Una empresa está especializada en la instalación y mantenimiento de diversos tipos de
alarmas para bancos. Cada vez que se inicia un nuevo año, las demandas de servicios
que reciben suelen ser para la instalación de una nueva alarma. La tabla muestra las
probabilidades estimadas para el número de peticiones de una nueva alarma en las tres
últimas semanas de enero.
Peticiones 0 1 2 3 4
Probabilidad 0,12 0,16 0,27 0,29 0,16

(a) Dibujar la función de probabilidad.


(b) Hallar y dibujar la función de distribución acumulada.
(c) Calcular la probabilidad de que durante ese perı́odo de tres semanas se generen al
menos dos peticiones.
(d) Hallar la media y la desviación tı́pica del número de peticiones de una nueva alarma
en ese perı́odo de tres semanas.

28. Al invertir en unas acciones particulares, Humberto puede tener una ganancia en un año
de $8.000.000 con probabilidad de 0,4 o tener una pérdida de $2.000 con probabilidad de
0,6.
(a) ¿Cuál es la ganancia esperada de esta persona? Interprete su respuesta.
(b) ¿Cuál es la varianza de esta persona?
29. Una compañı́a fabrica paquetes de minas para portaminas. El número de minas por
paquete varı́a, como se indica en la tabla de abajo.

Número de minas 7 8 9 10 11 12 13
Proporción de paquetes 0,21 0,29 0,03 0,20 0,10 0,04 0,13

(a) Dibujar la función de probabilidad.


(b) Hallar y dibujar la función de distribución acumulada.
(c) ¿Cuál es la probabilidad de que un paquete elegido aleatoriamente contenga entre 8
y 12 minas (ambos inclusive)?
(d) Hallar la media y la desviación tı́pica del número de minas por paquete.
(e) El costo (en pesos) de fabricar un paquete de minas es 1.000 + 2X, donde X es el
número de minas por paquete. El ingreso por la venta de un paquete, independiente-
mente del número de minas que contenga, es de 3.000 pesos. Si el beneficio se define
como la diferencia entre el ingreso y el costo, hallar la media y la desviación tı́pica
del beneficio por paquete.
3.4 La distribución uniforme (discreta) 29

3.4 La distribución uniforme (discreta)


A partir de esta sección, estudiaremos algunas distribuciones de probabilidades discretas
especiales, que poseen un importante significado teórico y práctico. Una de las más
simples es la llamada distribución uniforme.

Definición 3.4.1 Una variable aleatoria discreta X con los valores enteros sobre el
intervalo [a, b] tiene distribución uniforme discreta sobre el conjunto de los
1
números enteros que están en el intervalo [a, b], cuando se tiene que P(X = x) = n ,
para todo x entero que está en el intervalo [a, b].

Por tanto, una variable aleatoria distribuida uniformemente es caracterizada por el he-
cho de que ella sólo puede tomar finitos valores y todos estos valores tienen la misma
probabilidad (una distribución uniforme sobre un conjunto infinito y enumerable de va-
lores, obviamente, no se puede dar). Para el caso en que X tenga valores 1, 2, . . . , n,
la densidad de probabilidad y la correspondiente función de distribución de X estarán
dadas, respectivamente, por


1
, si x ∈ N, 0, si t < 0,

f(x) = n y F(t) = n k
, si k ≤ t < k + 1, con k = 1, . . . , n − 1.
0, si x 6∈ N, 

1, si n ≤ t.

Algunos ejemplos de situaciones en donde se tiene una distribución uniforme discreta


son los siguientes:

Ejemplo 3.4.2 (a) En una caja hay 7 bolas de la misma especie y marcadas con los
números 1, . . . , 7. La probabilidad de sacar una bola numerada con un determinado
número será siempre igual a 17 .
(b) Al lanzar un dado no falso, la probabilidad de obtener cualquier cara del dado será
igual siempre a 61 . ◭

Teorema 3.4.3 Suponga que X es una variable aleatoria que tiene distribución uni-
forme discreta sobre el intervalo [a, b]. Entonces,

a+b (b − a + 1)2 − 1
E(X) = y V(X) = .
2 12

Ejemplo 3.4.4 Un sistema de comunicación de voz de un negocio contiene 48 lı́neas exter-


nas. En un tiempo particular, se observa el sistema y algunas de las lı́neas están en uso.
Sea X la variable aleatoria que denota al número de las 48 lı́neas de voz que están en uso en
un tiempo dado. Suponga que X es una variable aleatoria discreta uniforme con rango de
valores de 0 a 48. Entonces,

48 + 0 (48 − 0 + 1)2 − 1
µ= = 24, σ2 = = 199, 396. ◭
2 12
3.5 La distribución binomial 30

✍ Ejercicios de la sección 3.4


30. La variable X tiene una distribución uniforme sobre los enteros 7 ≤ x ≤ 10. Determine la
media y la varianza de X.
31. La variable X tiene una distribución uniforme sobre los enteros 15 ≤ x ≤ 40. Determine
la media y la varianza de X.
32. En un proceso de recubrimiento se toman varias mediciones del espesor, hasta la centésima
de milı́metro más cercana. Las mediciones están distribuidas de manera uniforme, con
valores 0,12; 0,13; 0,14, 0,15; 0,16 y 0,17. Para este proceso, calcule la media y la varianza
del espesor del recubrimiento. Interprete la media.
33. Sea X una variable aleatoria discreta que puede asumir con la misma probabilidad los
valores 3, 7 ó 14. Determine la media y la varianza de X.
34. Se mide la longitud de varias placas de vidrio, hasta la décima de milı́metro más cercana.
Las longitudes están distribuidas de manera uniforme, con valores que están espaciados
una décima de milı́metro comenzando en 320,0 y continuando hasta 320,9. Calcule la
media y la varianza de las longitudes. Interprete la media.

3.5 La distribución binomial


Experimento de Bernoulli
En la vida diaria podemos encontrar experimentos, llamados experimentos de Bernouilli,
en donde sólo hay dos resultados posibles como, por ejemplo, masculino y femenino;
letrado e iletrado; miembro o no miembro; soltero o casado; que va a la escuela y que
no va, etc. A estos experimentos se les puede asociar una variable aleatoria para iden-
tificar la “ocurrencia” o “no ocurrencia” de cierto evento. La ocurrencia de tal evento
se le considerará un “exito” y la no ocurrencia, un “fracaso”. En conclusión, podemos
formular la siguiente

Definición 3.5.1 Un experimento de Bernoulli es un experimento aleatorio


con sólo dos resultados posibles: “éxito” y “fracaso” y en donde un éxito ocurre con
probabilidad p, siendo 0 < p < 1.

Ejemplo 3.5.2 Considere el experimento que consiste en disparar un misil y en donde ha


sido observado que se dispara con éxito con una probabilidad de p = 0, 88. Sea X la variable
aleatoria definida por

0, si se dispara el misil con éxito;
X=
1, si se fracasa al lanzar el misil.

Observe que este experimento es un ejemplo de un experimento de Bernoulli. Se puede


verificar fácilmente que la función de probabilidad de la variable aleatoria X es

(0, 88)x (0, 12)1−x , para x = 0, 1;
f(x) =
0, de otro modo.

Entonces, la probabilidad con que el misil será disparado exitosamente es P(X = 1) = f(1) =
0, 88 y la de fallar es P(X = 0) = f(0) = 0, 12. ◭
3.5 La distribución binomial 31

Experimento binomial
Considere el experimento de lanzar una moneda 10 veces y observar el número de
“caras” que resultan. Como puede observarse, este experimento tiene las siguientes
caracterı́sticas:

• El experimento “lanzar una moneda” es un experimento de Bernoulli (hay dos


resultados posibles: “cara” y “sello”).

• Este experimento se ejecuta n = 10 veces.

• Todos los 10 experimentos son idénticos (por ser el mismo experimento de Bernoulli).

• Todos los 10 experimentos son independientes, es decir, el resultado de un expe-


rimento no afecta al del otro.

• La probabilidad p = 21 de obtener una “cara” permanece constante de un experi-


mento a otro (por ser el mismo experimento de Bernoulli).

Este experimento que se acaba de describir es un ejemplo de un tipo especial de expe-


rimento llamado experimento binomial.

Definición 3.5.3 Un experimento binomial es un experimento de Bernoulli que


se ejecuta n veces, de tal manera que las diferentes ejecuciones se efectúen inde-
pendientemente unas de las otras, es decir, el resultado de cualquier experimento
particular no influye sobre el resultado de cualquier otro experimento.

Distribución binomial
Si se conoce la probabilidad de que un ensayo determinado producirá un éxito, es posible
estimar cuántos éxitos habrá en un número dado de experimentos, como se muestra en
el siguiente ejemplo:

Ejemplo 3.5.4 Supongamos que una moneda se lanza tres veces. Entonces, los posibles
resultados del espacio muestral correspondiente serán:

CCC, CCS, CSC, CSS, SSS, SSC, SCS, SCC.

O sea, hay en total 8 resultados posibles. Ahora, sea X la variable aleatoria “número de
caras que resultan en los tres lanzamientos”. Entonces,
(a) La probabilidad de que resulten 0 caras es P(X = 0) = 81 , porque en esta situación los
casos posibles será SSS (o sea, 1 caso de 8 en total).

Esta probabilidad se puede calcular de otra manera:6

P(X = 0) = P(SSS) = P(S) P(S) P(S) = (1 − p)3


= 1 p0 (1 − p)3 = 30 p0 (1 − p)3−0


6 1
De aquı́ en adelante, téngase en cuenta que P(C) = P(‘‘cara") = p = 2
y P(S) = P(‘‘sello") =
1 − p = 12 .
3.5 La distribución binomial 32

y esto es igual a 81 porque p = 12 . Por consiguiente, P(X = 1) también se puede


calcular multiplicando los siguientes tres factores:
• 30 = 1, el número de posibilidades en que se puede escoger 0 caras de un grupo


de 3 elementos.
• p0 = 1, la probabilidad de que salga cara elevada al número de caras que apare-
cen (que es 0).
3
• (1 − p)3−0 = 12 , la probabilidad de que salga sello elevada al número de sellos
que aparecen (que es 3).
(b) La probabilidad de que resulte 1 cara es P(X = 1) = 38 , porque en esta situación los
casos posibles serán CSS, SSC, SCS (o sea, 3 casos de 8 en total).

Esta probabilidad se puede calcular de otra manera:

P(X = 1) = P(CSS ó SSC ó SCS) = P(CSS) + P(SSC) + P(SCS)


= p1 (1 − p)2 + p1 (1 − p)2 + p1 (1 − p)2
= 3 p1 (1 − p)2
3
 1 3−1
= 1 p (1 − p)

y esto es igual a 83 porque p = 12 . Por consiguiente, P(X = 1) también se puede


calcular multiplicando los siguientes tres factores:
• 31 = 3, el número de posibilidades en que se puede escoger 1 cara de un grupo


de 3 elementos.
1
• p1 = 12 , la probabilidad de que salga cara elevada al número de caras que
aparecen (que es 1).
2
• (1 − p)3−1 = 21 , la probabilidad de que salga sello elevada al número de sellos
que aparecen (que es 2).
(c) La probabilidad de que resulten 2 caras es P(X = 2) = 38 , porque en esta situación los
casos posibles serán CCS, CSC, SCC (o sea, 3 casos de 8 en total).

Esta probabilidad se puede calcular de otra manera:

P(X = 2) = P(CCS ó CSC ó SCC) = P(CCS) + P(CSC) + P(SCC)


= p2 (1 − p)1 + p2 (1 − p)1 + p2 (1 − p)1
= 3 p2 (1 − p)1
3
 2 3−2
= 2 p (1 − p)

y esto es igual a 83 porque p = 12 . Por consiguiente, P(X = 2) también se puede


calcular multiplicando los siguientes tres factores:
• 32 = 3, el número de posibilidades en que se puede escoger 2 caras de un grupo


de 3 elementos.
2
• p2 = 12 , la probabilidad de que salga cara elevada al número de caras que
aparecen (que es 2).
1
• (1 − p)3−2 = 21 , la probabilidad de que salga sello elevada al número de sellos
que aparecen (que es 1).
3.5 La distribución binomial 33

(d) La probabilidad de que resulten 3 caras es P(X = 3) = 18 , porque en esta situación los
casos posibles será CCC (o sea, 1 caso de 8 en total).

Esta probabilidad se puede calcular de otra manera:

P(X = 3) = P(CCC) = P(C) P(C) P(C) = p3


= 1 p3 (1 − p)0 = 33 p3 (1 − p)3−3


y esto es igual a 81 porque p = 12 . Por consiguiente, P(X = 3) también se puede


calcular multiplicando los siguientes tres factores:
• 33 = 1, el número de posibilidades en que se puede escoger 3 caras de un grupo


de 3 elementos.
3
• p3 = 12 , la probabilidad de que salga cara elevada al número de caras que
aparecen (que es 3).
0
• (1 − p)3−3 = 21 = 1, la probabilidad de que salga sello elevada al número de
sellos que aparecen (que es 0). ◭

El segundo método utilizado para calcular las probabilidades obtenidas en el ejemplo


3.5.4 se puede generalizar, como se muestra en el siguiente teorema:

Teorema 3.5.5 Consideremos un experimento binomial con n experimentos. Sean


X el “número de éxitos” en los n experimentos y p, la probabilidad de un éxito.
Entonces, la probabilidad de que haya k éxitos en los n experimentos está dada por

P(X = k) = n
 k n−k
k p (1 − p) , k = 0, 1, 2, . . . , n.

La correspondiente distribución de X se conoce con el nombre de distribución


binomial con parámetros n y p.

Observemos que, en el teorema 3.5.5, la probabilidad P(X = k) se calcula multiplicando los siguientes
tres factores:
• nk , el número de posibilidades en que se puede escoger k éxitos de un grupo de n elementos.


• pk , la probabilidad de un éxito elevada al número de éxitos (que es k).


• (1 − p)n−k , la probabilidad de un fracaso elevada al número de fracasos (que es n − k).
Como podemos verificar, las funciones de probabilidad f y de distribución F de una
variable aleatoria que tiene distribución binomial con parámetros n y p están dadas por
n k n−k, si k = 0, 1, 2, . . . , n;
b(k; n; p) := f(k) = k p (1 − p)
0, de otra manera.
y X
B(t; n; p) := F(t) = P(X ≤ t) = b(k; n; p),
k≤t

respectivamente, en donde la suma anterior recorre todos los enteros no negativos que
son menores o iguales que t. Como vemos, en el caso n = 1, la distribución binomial
coincide con la distribución de Bernoulli con parámetro p. En la figura 3.6 se muestran
gráficas de la distribución de binomial para varios valores de n, pero manteniendo fijo
el producto entre n y p.
3.5 La distribución binomial 34

Fig. 3.6: Distribuciones de Bernoulli para varios valores de n pero fijo np = 3.

Uso de tablas binomiales


Incluso para un valor relativamente pequeño de n, el cálculo de probabilidades binomiales
puede ser tedioso. La tabla del apéndice tabula la función de distribución acumulada
F(t) = P(X ≤ t) = B(t; n; p) para n = 5, 10, 15, 20, 25 en combinación con valores
seleccionados de p. Por ejemplo,

• B(7; 10; 0, 5) es la entrada en la fila x = 7, y en la columna p = 0, 5 de la tabla


binomial correspondiente a n = 10. De la tabla binomial del apéndice, obtenemos
que B(7; 10; 0, 5) = 0, 945.

• B(8; 15; 0, 2) es la entrada en la fila x = 8, y en la columna p = 0, 2 de la tabla


binomial correspondiente a n = 15. De la tabla binomial del apéndice, obtenemos
que B(8; 15; 0, 20) = 0, 999.

• B(4; 20; 0, 1) es la entrada en la fila x = 4, y en la columna p = 0, 1 de la tabla


binomial correspondiente a n = 20. De la tabla binomial del apéndice, obtenemos
que B(4; 20; 0, 1) = 0, 957.

Los siguientes ejemplos ilustran algunas de las muchas aplicaciones de la distribución


binomial.

Ejemplo 3.5.6 Una moneda no falsa es lanzada 10 veces. Consideraremos el evento “cara”
como un éxito y “sello” como un fracaso. Es claro que p = 0, 5, n = 10 y las condiciones
básicas que caracterizan a la distribución binomial se satisfacen. Por consiguiente,
• La probabilidad de tener éxito exactamente 7 veces es
 
10 15
P(X = 7) = b(7; 10; 0, 5) = (0.5)7 (0.5)3 = ≈ 0, 1172.
7 128
3.5 La distribución binomial 35

Esta probabilidad también se puede calcular con ayuda de la tabla binomial, a saber,
P(X = 7) = P(X ≤ 7) − P(X ≤ 6) = B(7; 10; 0, 5) − B(6; 10; 0, 5)
= 0, 945 − 0, 828 = 0, 117.

• La probabilidad de tener a lo más 7 éxitos es


P(X ≤ 7) = B(7; 10; 0, 5) = 0, 945.

• La probabilidad de tener por lo menos 3 éxitos se puede calcular de la siguiente


manera:
P(X ≥ 3) = 1 − P(X < 3) = 1 − P(X ≤ 2)
= 1 − B(2; 10; 0, 5) = 1 − 0, 055 = 0, 945.

• La probabilidad de ningún éxito es


1
P(X = 0) = b(0; 10; 0, 5) = (0, 5)10 = ≈ 9.766 × 10−4 . ◭
1.024
Ejemplo 3.5.7 Una persona dispara a un objetivo 6 veces. La probabilidad de dar en el
blanco es p = 0, 40. (a) ¿Cuál es la probabilidad de que él dé en el blanco por lo menos
una vez? (b) ¿Cuántas veces debe disparar al objetivo para que la probabilidad de dar en
el blanco por lo menos una vez sea más grande que 0, 77?
SOLUCION:
La respuesta en (a) será
P(X ≥ 1) = 1 − P(X ≤ 0) = 1 − P(X = 0) = 1 − b(0; 6; 0, 4)
= 1 − (0, 6)6 ≈ 0.953.
Para (b), debemos encontrar n tal que P(X ≥ 1) > 0, 77, es decir, encontrar n tal que
0, 77 < P(X ≥ 1) = 1 − P(X < 1)
= 1 − P(X = 0) = 1 − b(0; n; 0, 4) = 1 − (0, 6)n ,
es decir, tal que 1 − (0, 6)n > 0, 77. Resolviendo esta desigualdad, encontramos que n > 2, 9.
Es decir, la persona debe disparar al objetivo 3 o más veces para mantener una probabilidad
mayor que 0, 77 de dar en el blanco por lo menos una vez. ◭

Esperanza y varianza de la distribución binomial


Antes mostramos cómo determinar la esperanza y la varianza de una distribución disc-
reta utilizando las fórmulas dadas en las definiciones 3.3.2 y 3.3.12. Sin embargo, si sólo
hay dos resultados posibles, como en la distribución binomial, la esperanza y la varianza
pueden determinarse más facilmente, como se muestra en el siguiente teorema:

Teorema 3.5.8 Si X es una variable aleatoria que tiene distribución binomial con
los parámetros n y p, entonces, se cumple que E(X) = np y V(X) = np(1 − p).

Ejemplo 3.5.9 Volvamos al ejemplo 3.5.6. La media (o esperanza) del número de caras es
µ = np = (10)(0, 5) = 5
y la varianza
σ2 = np(1 − p) = (10)(0, 5)(1 − 0, 5) = 2, 5. ◭
3.5 La distribución binomial 36

✍ Ejercicios de la sección 3.5


35. Utilizando la fórmula binomial, calcule las siguientes probabilidades binomiales:
(a) b(2; 7; 0, 4).
(b) b(4; 4; 0, 9).
(c) P(2 ≤ X < 4) cuando n = 3 y p = 0, 2.
(d) P(2 ≤ X) cuando n = 11, p = 0, 5 y si X toma sólo valores no negativos.
36. Usando la tabla binomial, calcule las siguientes probabilidades:
(a) B(3; 5; 0, 3).
(b) b(8; 10; 0, 4).
(c) b(12; 15; 0, 5).
(d) P(X ≤ 3) cuando n = 5 y p = 0, 7.
(e) P(4 ≤ X ≤ 9) cuando n = 25 y p = 0, 6.
(f) P(5 ≤ X) cuando n = 10 y p = 0, 8.
(g) P(14 < X < 20) cuando n = 20 y p = 0, 9.
37. Una semilla tiene un porcentaje de germinación del 83% . Si se siembran 12 semillas,
¿cuál es la probabilidad de que germinen (a) todas, (b) 10, (c) a lo más 2, (d) al menos
10?
38. De un cargamento de 100 artı́culos, se sabe que el 10% de los artı́culos están defectuosos.
Se eligen al azar con reemplazo y sin orden 20 artı́culos del cargamento y se examinan.
Sea X la variable aleatoria que representa al número de artı́culos defectuosos encontrados.
Construya la función de probabilidad de X, calcule la media (interprétela) y la varianza.
39. Un agente de seguros piensa que en un contacto concreto, la probabilidad de conseguir
una venta es 0,4. Sea X la variable aleatoria que representa al número de ventas que
consigue. Si tiene cinco contactos directos y para cada uno la probabilidad conseguir una
venta es 0,4:
(a) Construya la función de probabilidad.
(b) ¿Cuál es la probabilidad de que el número de éxitos este entre 2 y cuatro (ambos
inclusive)?
(c) ¿Cuál es la probabilidad de al menos un éxito?
(d) Calcule la media, la varianza y la desviación estándar.
40. Con el propósito de establecer el grado de aceptación de su producto, una empresa selec-
ciona una muestra de 1.000 consumidores de una población de 1.000.000, de forma tal que
cada uno de los elementos de la población tiene la misma probabilidad de ser seleccionado.
A cada consumidor seleccionado se le pregunta si prefiere el producto producido por esta
empresa o no. ¿Es este un experimento binomial? Explique su respuesta.
41. Un lote de 25 computadores llega a un distribuidor, el cual selecciona aleatoriamente y
sin reemplazo, 5 computadores para verificar si están defectuosos o no. El distribuidor
ignora que 3 de los 25 están defectuosos. ¿Es este un experimento binomial? Justifique
su respuesta.
42. El examen TELP consta de 150 preguntas de elección múltiple y hay 4 opciones en cada
una de ellas. Si muchas personas que no saben inglés, realizan el examen, calcule la media
de las calificaciones obtenidas.
3.5 La distribución binomial 37

43. De una producción de 2.000 tornillos, se sabe que el 5% están defectuosos. Supongamos
que se selecciona un muestra al azar de 20 tornillos.
(a) ¿Cuál es la probabilidad de que el número de tornillos defectuosos en la muestra no
exceda a 3?
(b) ¿Cuál es la probabilidad de que el número de tornillos defectuosos en la muestra es
por lo menos 6?
(c) ¿Cuál es la probabilidad de que el número de tornillos defectuosos en la muestra sea
estrictamente mayor que 2, pero menor o igual de 6?
(d) ¿Cuál es la probabilidad de que ninguno de los 20 tornillos esté defectuoso?
(e) Calcule e inteprete el valor esperado y la desviación estándar del número de tornillos
defectuosos en la muestra.
44. En un peaje se cobra 1.500 pesos por cada bus de transporte público y 2.500 pesos por
carros particulares. Supongamos que durante las horas diurnas, 70% de todos los vehı́culos
son buses de transporte públicos. Si 15 vehı́culos pasan por el peaje durante un perı́odo
particular diurno, ¿cuál es el ingreso de cuotas esperado? (Sugerencia: sea X el número
de buses de transporte público, entonces, el ingreso de cuotas h es una función lineal de
X.)
45. Un fabricante de celulares, desea controlar la calidad de su producto y rechazar cualquier
lote en el que la proporción de celulares defectuosos sea demasiado alta. Con este fin, de
cada lote grande (digamos, 20.000 celulares) selecciona y prueba 25. Si por lo menos 3
de éstos están defectuosos, todo el lote será rechazado.
(a) ¿Cuál es la probabilidad de que un lote sea rechazado si 5% de los celulares están
defectuosos?
(b) ¿Cuál es la probabilidad de que un lote sea rechazado si 10% de los celulares están
defectuosos?
(c) ¿Cuál es la probabilidad de que un lote sea rechazado si 30% de los celulares están
defectuosos?
(d) ¿Qué sucederı́a con las probabilidades anteriores si el número crı́tico para rechazo
aumentara de 3 a 5?
46. Un jefe de producción sabe que el 4% de 200 artı́culos producidos en cierto tipo de máquina
tiene algún defecto. Se examinan cinco de estos artı́culos. ¿Cuál es la probabilidad de
que (a) ninguno, (b) dos, (c) al menos dos de estos artı́culos tengan un defecto?
47. Una institución beneficiaria contrata personal para que soliciten donaciones por teléfono.
Después de un breve perı́odo de preparación, las personas telefonean a los potenciales
donantes y se les paga una comisión. La experiencia indica que, normalmente, estas
personas logran sólo un éxito moderado, y el 70% de ellas deja el trabajo en las tres
primeras semanas. La institución contrata seis personas, las cuales se pueden considerar
como una muestra aleatoria. ¿Cuál es la probabilidad de que al menos dos de las cinco
personas (a) dejen, (b) no dejen el trabajo en las tres primeras semanas?
48. Una empresa se dedica a la instalación de nuevos paquetes computacionales. Se ha
comprobado que en el 10% de 250 instalaciones es necesario volver para realizar algu-
nas modificaciones. En una semana determinada se realizaron 10 instalaciones. Asumir
independencia en los resultados de esas instalaciones.
(a) ¿Cuál es la probabilidad de que sea necesario volver en cinco casos?
(b) ¿Cuál es la probabilidad de que no sea necesario volver en ninguno los casos?
3.6 La distribución de Poisson 38

(c) ¿Cuál es la probabilidad de que sea necesario volver en más de un caso?


49. En cierto cultivo de peces, el 40% de los peces son de la especie Pecius y el otro 60%, de
la especie Pecelius. Peces de la especie Pecius produce peces de la especie Pecius 29%
de las veces, mientras que peces de la especie Pecelius produce peces de la especie Pecius
26% de las veces. Suponga que se seleccionan al azar 10 peces.
(a) ¿Cuál es la probabilidad de que exactamente cinco de esos peces provengan de la
especie Pecius y produzcan peces de la especie Pecius?
(b) ¿Cuál es la probabilidad de que exactamente cinco de esos peces sean de la especie
Pecius?
50. Al realizar una entrevista a un grupo de personas con el fin de ingresar en un programa de
televisión, se encuentra que 25% de las personas no cumplen con los requisitos requeridos.
De las siguientes 15 personas entrevistadas, encuentre la probabilidad de que (a) menos
de cuatro, (b) de cuatro a siete, (c) más de seis no cumplan con los requisitos requeridos.
51. Una investigación en cierto pais arrojó que aproximadamente 60% cree el actual presidente
de ese pais está haciendo las cosas bien. ¿Cuál es la probabilidad de que al menos cinco
de las siguientes diez personas seleccionadas al azar sean de esta opinión?
52. Se sabe que 30% de las vacas vacunadas con un suero quedan protegidos de cierta enfer-
medad. Si se vacunan 20 vacas, encuentre la probabilidad de que (a) ninguna, (b) menos
de dos, (c) más de tres contraigan la enfermedad.

3.6 La distribución de Poisson


Experimento y proceso de Poisson
Consideremos las siguientes variables aleatorias:

1. El número de partı́culas emitidas por cierta sustancia radioactiva en un determi-


nado lapso de tiempo.

2. El número de accidentes de tráfico que ocurren en un dı́a en un cruce.

3. El número de llamadas que llegan a una central telefónica en cierto intervalo de


tiempo.

4. El número de órdenes de devolución de piezas que recibe una empresa en una


semana.

5. El número de niños nacidos con un problema en el corazón en una cita grande


durante un año.

6. El números de lanzamientos “no golpeados” por beibolista famoso durante su


carrera.

7. El número de veces que falla una pieza de un equipo durante un perı́odo de tres
meses.

8. El número de nuevas infecciones por una enfermedad contagiosa en una población


durante un mes.
3.6 La distribución de Poisson 39

9. El número de mordeduras de serpientes venenosas en un tiempo determinado.


10. El número de huelgas anuales en un empresa.
Cada una de estas variables aleatorias se caracteriza por ser el número de ocurrencia de
cierto suceso durante un perı́odo de tiempo. Estas variables aleatorias están asociadas a
experimentos aleatorios que son conocidos con el nombre de experimentos de Poisson.

Definición 3.6.1 Los experimentos que resultan en valores numéricos de una varia-
ble aleatoria que representa el número de resultados durante un intervalo de tiempo
dado se llaman experimentos de Poisson.

Un experimento de Poisson surge del llamado proceso de Poisson, el cual explicaremos


a continuación. Consideremos la situación ilustrada en la figura 3.7, donde se mide el
tiempo a lo largo de la lı́nea horizontal, y supongamos que estamos interesados en el
perı́odo que comienza en 0 y termina en t. Las ocurrencias de sucesos a lo largo del eje
temporal se indican con el sı́mbolo ⋆. Por tanto, en esta ilustración ocurren seis sucesos
en el perı́odo de tiempo relevante.

Fig. 3.7: Ilustración del número aleatorio de ocurrencias ⋆ de un suceso de tiempo

Entonces, un proceso de Poisson está caracterizado por las siguientes tres propiedades:
(P1) Para cada intervalo de tiempo pequeño,7 la probabilidad de que ocurra un suceso
en ese intervalo es aproximadamente proporcional a la amplitud del intervalo, es
decir, si A es un evento que ocurre en el intervalo de tiempo [0, t], entonces,
P(A) ≈ λt, para un número real λ > 0.

Este número λ es llamado el parámetro del proceso de Poisson y repre-


senta al número promedio de ocurrencias por unidad de tiempo.
(P2) La probabilidad de que más de un evento ocurra en un intervalo, como el descrito
anteriormente, es despreciable en comparación con la probabilidad de la ocurrencia
de cada evento. Es decir, si A, B, C son eventos que ocurren en [0, t], entonces,
las probabilidades P(A ∩ B), P(A ∩ C), P(B ∩ C) y P(A ∩ B ∩ C) son despreciables
en comparación con P(A), P(B) y P(C).
(P3) El número de resultados que ocurren en un intervalo de tiempo es independiente
del número de resultados que ocurren antes de ese tiempo.
En la siguiente sección presentaremos una fórmula que nos permite calcular la proba-
bilidad de que ocurra una cantidad determinada de eventos en un intervalo de tiempo
pequeño.
7
Este intervalo de tiempo está representado mediante un pequeño segmento entre 0 y t del eje
temporal de la figura 3.7
3.6 La distribución de Poisson 40

Distribución de Poisson
La experiencia indica que, para una amplia gama de problemas como los mostrados al
comienzo de esta sección, la llamada distribución de probabilidad de Poisson representa
adecuadamente la estructura probabilı́stica del número de eventos que ocurren en un
intervalo de tiempo [0, t]. La demostración de la fórmula para la probabilidad de que
ocurra una cantidad determinada de eventos en un intervalo de tiempo pequeño, la cual
se basa en las propiedades del proceso de Poisson indicadas anteriormente, está fuera
del alcance de este texto. Por esta razón sólo se presentará lo que se utiliza para el
cálculos de diferentes tipos de probabilidades.

Teorema 3.6.2 Consideremos un proceso de Poisson con parámetro λ > 0 (es


decir, λ es el número promedio de ocurrencias por unidad de tiempo) y sea X el
“número de eventos que ocurren en un intervalo de tiempo [0, t]”. Entonces, la
probabilidad de que ocurran k eventos en el intervalo [0, t] está dada por

1 −λ k
P(X = k) = e λ , k = 0, 1, 2, 3, . . . .
k!
siendo e = 2, 71828 la base del logaritmo natural. La correspondiente distribución
de X se conoce con el nombre de distribución de Poisson con parámetro λ.

Las funciones de probabilidad f y de distribución F de una variable aleatoria X que tiene


distribución de Poisson con parámetros λ están dadas por
1 −λ k
k! e λ , si k = 0, 1, 2, . . .;
p(k; λ) := f(k) =
0, de otra manera.
y X
P(t; λ) := F(t) = P(X ≤ t) = p(t; λ),
k≤t
respectivamente, en donde la suma anterior recorre todos los enteros no negativos que
son menores o iguales que t. En la figura 3.8 se muestran gráficas de la distribución de
Poisson para varios valores de λ.
Ejemplo 3.6.3 Los sábados por la mañana, los clientes entran en una pequeña tienda de un
centro comercial suburbano a una tasa esperada de 0,50 por minuto. Halle la probabilidad
de que el número de clientes que entran en un intervalo especı́fico de 10 minutos es (a) 3,
(b) a lo más 3.
SOLUCION:
Las hipótesis del proceso de Poisson parecen ser razonables en este contexto. Damos por
sentado que los clientes no llegan en grupos (o podemos contar al grupo entero como un
solo cliente) y que la entrada de un cliente no aumenta ni disminuye la probabilidad de que
llegue otro. Para obtener λ, observamos que auna tasa media de 0,50 por minuto durante
un periodo de 10 minutos, podemos esperar λ = (0, 50)(10) = 5 entradas. Sea X la variable
aleatoria que representa al número de clientes que entran en un intervalo especı́fico de 10
minutos.
(a) Nos piden calcular P(X = 3). Para ello, aplicaremos el teorema 3.6.2 con λ = 5 y k = 3:
1 −5 3
P(X = 3) = e 5 = 0, 1403.
3!
3.6 La distribución de Poisson 41

Fig. 3.8: Distribuciones de Poisson para varios valores del parámetro λ.

(b) Ahora nos piden calcular P(X ≤ 3):

P(X ≤ 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3)


1 −5 0 1 −5 1 1 −5 2 1 −5 3
= e 5 + e 5 + e 5 + e 5
0! 1! 2! 3!
= 0, 0067 + 0, 0337 + 0, 0843 + 0, 1403
= 0, 2650. ◭

Uso de tablas de Poisson


Al igual que el cálculo de probabilidades binomiales, el cálculo de probabilidades de
Poisson también llega a ser tedioso. Por esta razón, también hay tablas, como la del
apéndice, que tabulan la función de distribución acumulada F(t) = P(X ≤ t) = P(t; λ)
para algunos valores de λ. Por ejemplo,

• P(0; 0, 1) es la entrada en la fila x = 0 y en la columna λ = 0, 1 de la tabla de


Poisson. De la tabla de Poisson del apéndice, obtenemos que P(0; 0, 1) = 0, 905.

• P(5; 1) es la entrada en la fila x = 5 y en la columna λ = 1 de la tabla de Poisson.


De la tabla de Poisson del apéndice, obtenemos que P(5; 1) = 0, 999.

• P(8; 8) es la entrada en la fila x = 8 y en la columna λ = 8 de la tabla de Poisson.


De la tabla de Poisson del apéndice, obtenemos que P(8; 8) = 0, 593.

• P(6; 0, 5) es la entrada en la fila x = 6 y en la columna λ = 0, 5 de la tabla


de Poisson. Obsérvese que allı́ no vemos ningún valor. Esto quiere decir que
supondremos que la probabilidad correspondiente será siempre 1. Es decir, de la
tabla de Poisson del apéndice, obtenemos que P(6; 0, 5) = 1.
3.6 La distribución de Poisson 42

• P(36; 2) es la entrada en la fila x = 36, y en la columna λ = 2 de la tabla de


Poisson. Como no hay ningún valor, supondremos que la probabilidad asignada es
1. Por tanto, P(36; 2) = 1.
Los siguientes ejemplos ilustran algunas de las muchas aplicaciones de la distribución de
Poisson.
Ejemplo 3.6.4 Un estudio indica que el número de huelgas anuales en una determinada
empresa con 2.000 empleados, se puede representar por una distribución de Poisson con
media λ = 0, 4. Sea X la variable aleatoria que representa al número de huelgas. Ahora,
con esta información y con ayuda de la tabla de Poisson del apéndice, podemos calcular
probabilidades para números concretos de huelgas anuales:
(a) La probabilidad de que no haya huelga es
P(X = 0) = P(0; 0, 4) = 0, 670.

(b) La probabilidad de que haya 3 huelgas es


P(X = 3) = P(X ≤ 3) − P(X ≤ 2) = P(3; 0, 4) − P(2; 0, 4)
= 0, 999 − 0, 992 = 0, 007.

(c) La probabilidad de que haya más de una huelga en una año es


P(X ≥ 1) = 1 − P(X < 1) = 1 − P(0; 0, 4)
= 1 − 0, 670 = 0, 33. ◭

Ejemplo 3.6.5 (Lı́neas de espera o colas) La distribución de Poisson ha resultado ser


muy útil en problemas de lı́neas de espera o colas. Los clientes llegan a una máquina
fotocopiadora a una tasa media de 2 cada 5 minutos. En la práctica, se pueden representar
los procesos de llegada de esta clase mediante una distribución de Poisson. Asumiendo que
éste es el caso, representaremos por X el número de llegadas de clientes en un perı́odo de
cinco minutos, con lo cual X tiene distribución de Poisson con media λ = 2.
(a) La probabilidad de que no haya llegadas en un perı́odo de cinco minutos es
P(X = 0) = P(0; 2) = 0, 135.

(b) La probabilidad de que haya 1 llegada es


P(X = 1) = P(X ≤ 1) − P(X ≤ 0) = P(1; 2) − P(0; 2)
= 0, 406 − 0, 135 = 0, 271.

(c) La probabilidad de que haya estrictamente más de dos llegadas es


P(X > 2) = 1 − P(X ≤ 2) = 1 − P(2; 2)
= 1 − 0, 677 = 0, 323. ◭

Ejemplo 3.6.6 El número promedio de partı́culas radiactivas que pasan a través de un


contador durante un milisegundo en un experimento de laboratorio es 4. ¿Cuál es la pro-
babilidad de que entren entre 3 y 6 (inclusives) partı́culas al contador en un milisegundo
determinado?
SOLUCION:
Sea X la variable aleatoria que representa al número de partı́culas que entran al contador.
Si se utiliza la distribución de Poisson con k = 6 y λ = 4, se tiene que
P(3 ≤ X ≤ 6) = P(X ≤ 6) − P(X ≤ 2) = P(6; 4) − P(2; 4)
= 0, 889 − 0, 238 = 0, 651. ◭
3.6 La distribución de Poisson 43

Esperanza y varianza de la distribución de Poisson


El siguiente teorema muestra cómo se puede calcular la esperanza y la varianza de una
variable aleatoria que tiene distribución de Poisson.

Teorema 3.6.7 Si X es una variable aleatoria que tiene distribución de Poisson


con parámetro λ, entonces, se cumple que E(X) = V(X) = λ.

Ejemplo 3.6.8 En el ejemplo 3.6.3, tenemos que la media y varianza del número de clientes
que entran en un intervalo especı́fico de 10 minutos son µ = σ2 = 5. ◭

Aproximación de la distribución binomial a la de Poisson


Como hemos visto, la distribución de Poisson aparece de manera natural para represen-
tar el número de ocurrencias de un suceso en un perı́odo de tiempo. Esta distribución
tiene también otro uso. Ella también juega un papel importante como distribución lı́mite
de la distribucón binomial, en especial, para el cálculo numérico de las probabilidades
b(k; n; p) cuando n es grande, p pequeña y el producto np tiene un tamaño moderado.8

Las situaciones siguientes satisfacen estas condiciones:


1. Una compañı́a aseguradora mantiene un gran número de pólizas de seguro de vida en in-
dividuos de determinada edad, y la probabilidad de que durante el año se produzca una
reclamación en una póliza es muy pequeña. La distribución del número de reclamaciones es
binomial, con n grande y p muy pequeño.
2. Una compañı́a puede tener un gran número de máquinas trabajando en un proceso si-
multáneamente. Si la probabilidad de que cada una de ellas se averı́e en un dı́a concreto es
muy pequeña, entonces, la distribución del número de averı́as es binomial, con n grande y p
muy pequeño.
En estos casos, la distribución binomial puede aproximarse bien mediante la distribución
de Poisson con esperanza λ = np. Es decir, la media λ de la distribución de Poisson
aproximada está fija en el valor de la esperanza conocida np de la distribución binomial
que se quiere aproximar.

Teorema 3.6.9 (Aproximación de la binomial a la de Poisson) Sea X una


variable aleatoria binomial con parámetros n y p. Si n es grande (n ≥ 100), p
pequeña (p ≤ 0, 01) y np tiene un tamaño moderado (np ≤ 20), entonces, la dis-
tribución binomial con parámetros n y p puede aproximarse bien por la distribución
de Poisson con parámetro λ = np. Es decir, bajo estas condiciones se cumple que

b(k; n; p) ≈ p(k; np), k = 0, 1, 2, 3, . . .

o, que es equivalente,

B(k; n; p) ≈ P(k; np), k = 0, 1, 2, 3, . . . .

8
No hay una regla para el tamaño de p y n al aproximar la distribución binomial con la de
Poisson. En la práctica, si n ≥ 100, p ≤ 0, 01 y np ≤ 20, la aproximación será buena.
3.6 La distribución de Poisson 44

Los siguientes ejemplos ilustran algunos de los problemas en donde la distribución de


Poisson puede ser aplicada como aproximación de la distribución binomial.
Ejemplo 3.6.10 Una cierta compañı́a electrónica produce 15.000 unidades de un tipo es-
pecial de tubo al vacı́o. Se ha observado que, en promedio, 3 tubos de 300 son defectuosos.
La compañı́a empaca los tubos en cajas de 600. ¿Cuál es la probabilidad de que en una caja
de 600 tubos hayan (a) 5 tubos defectuosos, (b) por lo menos 3 defectuosos y (c) a lo más
1 defectuoso?
SOLUCION:
Sea X la variable aleatoria que representa al número de tubos defectuosos. Entonces, X es
una variable binomial con parámetros n = 600 y p = 0, 01.

Observemos que no podemos usar la tabla binomial por ser n muy grande. Por consiguiente,
debemos buscar una aproximación de la distribución binomial. La idea es aplicar el teorema
3.6.9. Observamos que
• n = 600 es grande,
• p = 0, 01 es pequeño,
• y se cumple que np = 6 ≤ 20.
Como se cumplen estos tres supuestos exigidos por el teorema, las probabilidades pedi-
das pueden ser calculadas (en forma aproximada) usando la distribución de Poisson con
parámetro λ = np = 6.
(a) Nos piden calcular P(X = 5). Por tanto, por el teorema de aproximación de la binomial
a la de Poisson (teorema 3.6.9), se tiene
P(X = 5) = P(X ≤ 5) − P(X ≤ 4) = B(5; 600; 0, 01) − B(4; 600; 0, 01)
≈ P(5; 6) − P(4; 6) = 0, 446 − 0, 285 = 0, 161.

(b) Nos piden calcular P(X ≥ 3). Por tanto, por el teorema de aproximación de la binomial
a la de Poisson (teorema 3.6.9), se tiene
P(X ≥ 3) = 1 − P(X ≤ 2) = 1 − B(2; 600; , 0, 01)
≈ 1 − P(2; 6) = 1 − 0, 062 = 0, 938.

(c) Nos piden calcular P(X ≤ 1). Por tanto, por el teorema de aproximación de la binomial
a la de Poisson (teorema 3.6.9), se tiene
P(X ≤ 1) = B(1; 600; 0, 01) ≈ P(1; 6) = 0, 017. ◭

Ejemplo 3.6.11 Suponga que es conocido que en un libro de matemáticas de 400 páginas
hay 200 errores que están distribuidos aleatoriamente en todo el texto. Calcular la proba-
bilidad de que en una página dada (a) no haya errores (b) 2 o más errores.
SOLUCION:
Sea X la variable aleatoria que representa al número de errores por página. Ya que la pro-
1
babilidad de que un error aparezca en una página dada es p = 400 = 0, 0025 y que n = 200,
es claro ver que X es una variable binomial con parámetros p = 0, 0025 y n = 200. Y,
como vemos, es justificable usar la distribución de Poisson y obtener las probabilidades con
λ = np = 0, 5. Por consiguiente,
P(X = 0) = B(0; 200, 0, 0025) ≈ P(0; 0, 5) = 0, 607 ≈ 60, 7%
y
P(X ≥ 2) = 1 − P(X ≤ 1) = 1 − B(1; 200; 0, 0025)
≈ 1 − P(1; 0, 5) = 1 − 0, 910 = 0, 09. ◭
3.6 La distribución de Poisson 45

Ejemplo 3.6.12 En la tabla de la figura 3.9 damos los resultados del famoso experimento
fı́sico, dirigido por Rutherford y Geigner, en donde se observaron partı́culas α emitidas por
una sustancia radioactiva en 2.068 periodos de 7, 5 segundos cada uno. Aquı́ k es el número
de partı́culas α emitidas y fo es el número de perı́odos de 7, 5 segundos observados.

k 0 1 2 3 4 5 6 7 8 9 10
fo 57 203 383 525 532 408 273 139 45 27 16

Fig. 3.9: Frecuencias observadas para el experimento de Rutherford y Geigner

En este experimento, n = 2.608 y p es bastante pequeña, y la distribución de la variable


X, que representa al número de partı́culas α emitidas, puede ser aproximada por la función
de probabilidad de Poisson. El número promedio λ de partı́culas α emitidas durante un
perı́odo de 7, 5 segundos es
10
P
kfobservado
k=0 0 · 57 + 1 · 203 + 2 · 383 + · · · + 10 · 16
λ = x = = = 3, 87
n 2.608
y, con esto, la función de probabilidad de Poisson estará dada por

e−3,87 (3, 87)k


pk := p(k; 3, 87) = , k = 0, 1, . . . , 10.
k!
Ahora, por ejemplo, calcularemos algunas probabilidades (e−3,87 ≈ 0, 021):
• La probabilidad de que en un periodo de 7, 5 segundos observemos 0 partı́culas es

e−3,87 (3, 87)0


P(X = 0) = p(0; 3, 87) = ≈ 0, 021.
0!

• La probabilidad de que en un periodo de 7, 5 segundos observemos 1 partı́cula es

e−3,87 (3, 87)1


P(X = 1) = p(1; 3, 87) = ≈ 0, 0807.
1!

• La probabilidad de que en un periodo de 7, 5 segundos observemos 2 partı́culas es

e−3,87 (3, 87)2


P(X = 12) = p(2; 3, 87) = ≈ 0, 1562.
2!

En la tabla 3.10 aparecen todas estas probabilidades.

k 0 1 2 3 4 5 6 7 8 9 10
pk 0,021 0,08 0,156 0,201 0,195 0,151 0,097 0,054 0,026 0,011 0,0065

Fig. 3.10: Probabilidades para el experimento de Rutherford y Geigner

Al calcular las frecuencias esperadas fe del número de perı́odos de 7, 5 segundos, mediante


la fórmula
fe = 2.680 pk ,
notamos (en la tercera fila de la tabla de la figura 3.11) que la función de probabilidad de
Poisson da una buena aproximación del problema (compárese los valores de fo y fe ).
3.6 La distribución de Poisson 46

k 0 1 2 3 4 5 6 7 8 9 10
fo 57 203 383 525 532 408 273 139 45 27 16
fe 54,7 210,5 407,4 525,5 508,4 393,5 253,8 140,3 67,9 29,2 17,1

Fig. 3.11: Frecuencias esperadas para el experimento de Rutherford y Geigner ◭

✍ Ejercicios de la sección 3.6


53. Sea X la cantidad de huecos en la superficie de una instrumento metálico de cierto tipo,
seleccionado al azar, con una distribución de Poisson con parámetro λ = 15 y utilice la
tabla del apéndice para calcular las siguientes probabilidades: (a) P(X ≤ 9), (b) P(X = 9),
(c) P(X ≥ 10), (d) P(7 ≤ X ≤ 11), (e) P(4 < X < 9).
54. Suponga que el número X de tormentas eléctricas observadas en cierta región durante un
periodo de 6 meses tiene una distribución de Poisson con λ = 9.
(a) Calcule P(X ≤ 11), P(7 ≤ X ≤ 12) y P(X ≥ 13).
(b) ¿Cuántas tormentas eléctricas se espera que se podrán ver durante un perı́odo de seis
meses,y cuál es la desviación estándar del número observado de tormentas eléctricas?
55. El número de cartas perdidas en el correo en un dı́a tiene un promedio de 4. ¿Cuál es la
probabilidad de que en un dı́a determinado
(a) se pierdan a lo más dos cartas en el correo?
(b) se pierdan tres cartas en el correo?
(c) se extravı́en cuatro o cinco?
(d) al menos desaparezca una carta en el correo?
56. En un lote de 1.000 bombillas fabricadas por una compañı́a, 10 son defectuosas. Utilice
la aproximación de la distribución binomial por la de Poisson para calcular la probabilidad
de que en una muestra de 20 bombillas, (a) 2, (b) 0, (c) por lo menos 3 sean defectuosas.
57. Las estadı́sticas muestran que hay un promedio de tres accidentes por semana en una
ruta determinada. Determine la probabilidad de que durante cierta semana seleccionada
al azar haya (a) 4, (b) 3 ó 4, (c) a lo más tres, (d) al menos 4 accidentes.
58. En cierto estudio se reporta que de cada 100 personas, una fuma. Consideremos una
muestra aleatoria de 2.000 personas.
(a) ¿Cuál es la distribución aproximada del número de quienes fuman?
(b) Utiliza la aproximación de la parte (a) para calcular la probabilidad aproximada de
que entre 8 y 20 (ambos inclusive) personas fumen.
(c) Utiliza nuevamente la aproximación de la parte (a) para calcular la probabilidad apro-
ximada de que estrictamente entre 12 y 30 personas fumen.
59. A través de un anuncio de televisión se le informa a todas las familias que deben llevar
a sus niños menores de 4 años (si los tienen) al hospital de la ciudad para hacerles un
chequeo médico debido a la presencia de un peligroso virus en la ciudad. Suponga que el
1% de tales niños tienen el virus. Considere una muestra aleatoria de 1.000 niños.
(a) ¿Cuáles son el valor esperado y la desviación estándar del número de niños de la
muestra que tienen el virus.
3.7 La distribución hipergeométrica 47

(b) ¿Cuál es la probabilidad (aproximada) de que por lo menos 10 niños de los muestreados
tengan el virus?
(c) ¿Cuál es la probabilidad (aproximada) de que ninguno de los niños en la muestra
tengan el virus?
60. Los estudios indican que, en promedio, se producen 2 averı́as diarias en las carreteras
urbanas durante las horas “pico” de la tarde. Asumamos que la distribución es de Poisson.
¿Cuál es la probabilidad de que en un dı́a concreto se produzcan (a) menos de tres, (b)
más de cinco averı́as en estas carreteras durante las horas “pico” de la tarde?
61. Suponga que los buses llegan a cierto terminal de transporte, según un proceso de Poisson,
con tasa α = 8 buses por hora, de modo que el número de llegadas por un periodo de t
horas es una variable aleatoria de Poisson con parámetro λ = 8t.
(a) ¿Cuál es la probabilidad de que exactamente 5 buses pequeños lleguen durante un
perı́odo de una hora? ¿Por lo menos 5? ¿A lo más 10?
(b) ¿Cuáles son el valor esperado y la desviación estándar del número de buses que llegan
durante un perı́odo de 90 minutos?
(c) ¿Cuál es la probabilidad de que por lo menos 20 buses lleguen durante un perı́odo de
2 horas y media? ¿De que a lo sumo 10 lleguen durante este perı́odo?
62. De las personas encarceladas que son sometidas a un detector de mentiras, 0,8% dicen la
verdad. Supongamos que se escoge una muestra aleatoria de 500 encarcelados.
(a) ¿Cuál es la función de probabilidad aproximada del número muestreado que dice la
verdad?
(b) Calcule la probabilidad de que a lo más 5 personas de las 500 dice la verdad.
(c) Calcule la probabilidad de que exactamente 5 personas de las 500 dice la verdad.
63. Supongamos que, en promedio, una persona comete dos errores por página. Determine
la probabilidad de que en la siguiente página cometa (a) ningún error, (b) por lo menos
cuatro errores.
64. Un fabricante de computadores se preocupa por el mal funcionamiento de cierto programa
estadı́stico en un modelo en particular. El mal funcionamiento puede producir en raras
ocasiones un bloqueo en el sistema operativo. Suponga que la distribución del número de
computadores por año que tienen un mal funcionamiento del paquete estadı́stico es la de
Poisson con λ = 5.
(a) ¿Cuál es la probabilidad de que a lo más dos computadores por año tenga un bloqueo
en el sistema operativo?
(b) ¿Cuál es la probabilidad de que más de un computador por año tenga un bloqueo en
el sistema operativo?

3.7 La distribución hipergeométrica


Experimento hipergeométrico
En esta sección queremos considerar experimentos que obedezcan las propiedades de
un experimento binomial, pero debilitando la propiedad de independencia entre los ex-
perimentos individuales, es decir, supondremos que los experimentos individuales son
dependientes. Este nuevo tipo de experimento resultante se llamará experimento hiper-
geométrico y se usan comúnmente cuando el muestreo se hace sin reemplazo. En general,
3.7 La distribución hipergeométrica 48

un experimento hipergeométrico con parámetros n, M y N está basado en las


siguientes suposiciones (véase la figura 3.12):
(H1) La población o conjunto donde deba hacerse el muestreo es una población finita
con N elementos.
(H2) Cada elemento de la población puede ser caracterizado como un éxito o un fracaso.
(H3) Hay M éxitos en la población.
(H4) Se elige una muestra sin reemplazo de n individuos, de tal forma que sea igual-
mente probable seleccionar cada subconjunto de tamaño n.

Fig. 3.12: Esquema gráfico de un experimento hipergeométrico

Distribución hipergeométrica
En un experimento hipergeométrico con parámetros n, M y N, como el descrito en la
sección anterior, la variable de interés X es siempre “el número de éxitos obtenidos en
la muestra”. La distribución de probabilidad de X, llamada distibución hipergeométrica,
depende de los parámetros n, M y N y la probabilidad que inicialmente nos interesa es-
tudiar es la de obtener k éxitos en la muestra, la cual simbolizaremos con h(k; n, M, N).
Es decir, estaremos interesados en calcular la probabilidad
P(X = k) = h(k; n, M, N),
cuya fórmula aparece después de analizar el siguiente ejemplo que identifica a un tipo
de experimento hipergeométrico.

Ejemplo 3.7.1 Una caja contiene, al comienzo de un experimento, 2 bolas blancas y 4


bolas negras. Ahora se sacan n = 3 bolas aleatoriamente, sin reemplazo. Determinar la
probabilidad de que entre las 3 bolas sacadas haya (a) 1 negra, (b) 2 negras y (c) 3 negras.
Además, (d) determine la distribución de probabilidad de X.
SOLUCION:
En la caja hay N = 6 bolas en total. Sea X la variable aleatoria que representa al número
de bolas negras elegidas de entre las 3 bolas sacadas. Esto quiere decir que “sacar una bola
negra” es un éxito y que M = 4. Es claro que los valores posibles de X son k = 0, 1, 2, 3.

Ahora, el número de formas de seleccionar una muestra de de n = 3 bolas de un total


de N = 6 bolas disponibles en la caja es
   
N 6
= = 20.
n 3
3.7 La distribución hipergeométrica 49

Por consiguiente, el espacio muestral correspondiente Ω tiene 20 elementos igualmente pro-


bables.
(a) Nos piden calcular P(X = 1). Determinemos la cantidad de maneras de escoger una
muestra de tamaño n = 3 que contiene k = 1 bola negra y n − k = 2 blancas:
• k = 1 bola negra
 de4un
 total de M = 4 bolas negras que hay en la caja se pueden
escoger de Mk = 1 = 4 formas.
• n − k = 2 bolas blancas de un total
 de  N − M = 2 bolas blancas que hay en la
caja se pueden escoger de N−M
n−k = 2
2 = 1 forma.

Por consiguiente, la cantidad de maneras de escoger una muestra de tamaño n = 3


que contiene k = 1 bolas negras y n − k = 2 blancas es igual a
     
M N−M 4 2
= = 4.
k n−k 1 2
Con esto, la probabilidad pedida será
4 2
 
1 2 4 1
P(X = 0) = 6
= = = 0, 20.
20 5

3

(b) Nos piden calcular P(X = 2). Determinemos la cantidad de maneras de escoger una
muestra de tamaño n = 3 que contiene k = 2 bolas negras y n − k = 1 blancas:
• k = 2 bolas negras de un total de M = 4 bolas negras que hay en la caja se
pueden escoger de M 4

k = 2 = 6 formas.
• n − k = 1 bola blanca de un total de N − M = 2 bolas blancas que hay en la
caja se puede escoger de N−M 2

n−k = 1 = 2 formas.

Por consiguiente, la cantidad de maneras de escoger una muestra de tamaño n = 3


que contiene k = 2 bolas negras y n − k = 1 blancas es igual a
     
M N−M 4 2
= = 12.
k n−k 2 1
Con esto, la probabilidad pedida será
4 2
 
2 1 12 3
P(X = 2) = 6
= = = 0, 60.
20 5

3

(c) Nos piden calcular P(X = 3). Determinemos la cantidad de maneras de escoger una
muestra de tamaño n = 3 que contiene k = 3 bolas negras y n − k = 0 blancas:
• k = 3 bolas negras de un total de M = 4 bolas negras que hay en la caja se
pueden escoger de M 4

k = 3 = 4 formas.
• n − k = 0 bolas blancas de un total
 de  N − M = 2 bolas blancas que hay en la
caja se pueden escoger de N−M
n−k = 2
0 = 1 forma.

Por consiguiente, la cantidad de maneras de escoger una muestra de tamaño n = 3


que contiene k = 3 bolas negras y n − k = 0 blancas es igual a
     
M N−M 4 2
= = 4.
k n−k 3 0
Con esto, la probabilidad pedida será
4 2
 
3 0 4 1
P(X = 3) = 6
= = = 0, 20.
20 5

3
3.7 La distribución hipergeométrica 50

(d) En la tabla de la figura 3.13 vemos la distribución de probabilidad para la variable


aleatoria hipergeométrica X, descrita en el ejemplo 3.7.1. Observe el patrón con las
entradas numéricas.

k P(X=k)

(41) (22) 1
1 =
(63) 5

(42) (21) 3
2 =
(63) 5

(43) (20) 1
3 =
(63) 5

Fig. 3.13: Distribución de probabilidad para la distribución hipergeométrica con


parámetros N = 6, M = 4 y n = 3. ◭

Para generalizar el método que usamos en el ejemplo 3.7.1 (véase la figura 3.14), supong-
amos que una población (en nuestro ejemplo, la caja) contiene N objetos (en nuestro
ejemplo, N = 6 bolas), dentro de los cuales hay M éxitos (en nuestro ejemplo, M = 4
bolas negras) y N − M fracasos (en nuestro ejemplo, N − M = 2 bolas blancas).
Supongamos que se sacan, aleatoriamente (sin reemplazo y sin orden) n objetos de la
población (en nuestro ejemplo, n = 3 bolas). Nuestro interés determinar el número de
éxitos escogidos que hay en los n objetos sacados. Ahora,

1. El número total de formas de escoger n objetos de N objetos de la población es


el coeficiente binomial N
n .

2. Supongamos que entre los n objetos escogidos hay k éxitos (esto quiere decir que
hay n − k fracasos). Como

• k éxitos
 de un total de M éxitos que hay en la población se pueden escoger
de M k formas y
• n − k fracasos de un total
 de N − M fracasos que hay en la población se
N−M
puede escoger de n−k formas,

entonces, la cantidad de maneras de escoger una muestra de tamaño n que con-


M N−M

tiene k éxitos y n − k fracasos es igual al producto k n−k .

En consecuencia, tenemos el siguiente teorema:


3.7 La distribución hipergeométrica 51

Fig. 3.14: Esquema gráfico para obtener la distribución hipergeométrica

Teorema 3.7.2 Sea X el número de éxitos obtenidos en una muestra escogida al


azar al realizar un experimento hipergeométrico con parámetros n, M y N. Entonces,
la probabilidad de elegir k éxitos en n intentos está dada por
M N−M
 
k n−k
P(X = k) = N
 , donde k = 0, 1, 2, . . . , n y n ≤ N. (3.1)
n

La correspondiente distribución de X se conoce con el nombre de distribución


hipergeométrica con parámetros n, M y N.

Como podemos verificar, las funciones de probabilidad f y de distribución F de una


variable aleatoria hipergeométrica con parámetros n, M y N están dadas por
 M N−M
 ( k ) ( n−k )
, si k = 0, 1, 2, . . . , n y n ≤ N;
h(k; n, M, N) := f(k) = (N )
 0, n de otra manera.
y X
H(t; n, M, N) := F(t) = P(X ≤ t) = h(k; n, M, N),
k≤t

respectivamente, en donde la suma anterior recorre todos los enteros k no negativos que
son menores o iguales que t.

Aplicaciones de la distribución hipergeométrica


La distribución hipergeométrica encuentra aplicaciones en los controles de calidad de
la producción colectiva. Por ejemplo, un cargamento de mercancı́a se compone de B
ejemplares buenos y de M ejemplares defectuosos. El buen ejemplar juega el papel de
un bola blanca y el defectuoso, de una bola negra. Para el control de calidad, escogemos
una cargamento de n ejemplares al azar y el ejemplar, precisamente escogido, no se echa
al cargamento, antes de la próxima escogencia. Si B y M fuesen conocidos, entonces,
se podrı́a aplicar la fórmula (3.1) para calcular la probabilidad de que, entre los n
ejemplares escogidos, hayan k en mal estado. Sin embargo, en la práctica, B y M no
son conocidos y la investigación de la calidad de un determinado número de ejemplares
sirve precisamente para la estimación de estos números desconocidos.
3.7 La distribución hipergeométrica 52

Ejemplo 3.7.3 Una cantidad de 60 componentes eléctricas están sujetas a un control de


calidad. Fue encontrado que 48 de las componentes no estaban defectuosas y las compo-
nentes que quedaban sı́ lo estaban. Si una muestra aleatoria de 15 componentes son escogidas
de este lote, ¿cuál es la probabilidad de que (a) exactamente 11 de ellas, (b) a lo más 3 de
ellas no estén defectuosas?
SOLUCION:
Sea X la variable aleatoria que representa al número de componentes no defectuosas. Apli-
cando la distribución geométrica con parámetros n = 15, N = 60 y M = 48, tenemos
48
 12
11
P(X = 11) = h(11; 15, 48, 60) = 4
60
= 0, 21026.
15

y
3 48 12 3 48 12
    48
 12

X j 15−j
X j 15−j
P(X ≤ 3) = 60
 = 60
 = 3
60
12 ≈ 3, 251 × 10−10 .
j=0 15 j=3 15 15

Observemos que la primera suma puede comenzar  a evaluarse desde j = 3 (como se observa
12
en la segunda suma) porque el coeficiente 15−j = 0, para todo j = 0, 1, 2. ◭

Ejemplo 3.7.4 El consejo de cierta universidad consiste de 66 senadores, 38 de los cuales


son de la facultad de ciencias, 28 de los cuales son de la de artes. Si un comité de 16
senadores fue escogido aleatoriamente, entonces, determine la probabilidad de que el comité
tenga por lo menos 2 senadores de la facultad de arte.
SOLUCION:
Sea X la variable aleatoria que representa al número de senadores escogidos de la facultad
de arte. Entonces, la probabilidad de que el comité tenga a lo más un senador de la facultad
de arte está dada por
28
1
 38  28
 38 28
 38
X j 16−j
P(X ≤ 1) = 66
 = 0
66
16
 + 1
66
15 ≈ 5, 324 × 10−4 .
j=0 16 16 16

Por consiguiente, la probabilidad de que el comité tenga por lo menos 2 senadores de la


facultad de arte será P(X ≥ 2) = 1 − P(X ≤ 1) ≈ 0, 9995%. ◭

Ejemplo 3.7.5 Una compañı́a recibe un pedido de 20 artı́culos. Dado que la inspección
de cada artı́culo es cara, se sigue la polı́tica de analizar una muestra de 6 art´’iculos de cada
envı́o (seleccionada sin reemplazo y sin orden), aceptando la remesa si no hay más de un
artı́culo defectuoso en la muestra. ¿Cuál es la probabilidad de que sea aceptado un pedido
con cinco artı́culos defectuosos?
SOLUCION:
Sea X la variable aleatoria que representa al número de artı́culos defectuosos en la muestra
de 5. Entonces,

P(aceptar el envı́o) = P(X ≤ 1) = P(X = 0) + P(X = 1)


15 5 15
  
6 1
= 20
 + 20
5
6 6
= 0, 129 + 0, 387 = 0, 516.

Por consiguiente, la probabilidad de que sea aceptado un pedido con cinco artı́culos defec-
tuosos es de 0,516. ◭
3.7 La distribución hipergeométrica 53

Esperanza y varianza de la distribución hipergeométrica


El siguiente teorema muestra cómo se puede calcular la esperanza y la varianza de una
variable aleatoria que tiene distribución hipergeométrica.

Teorema 3.7.6 Si X es una variable aleatoria que tiene distribución hiper-


geométrica con parámetros n, M y N, entonces, se cumple que
   
M N−n M M
E(X) = n · y V(X) = ·n· · 1− .
N N−1 N N

La razón M/N es la proporción de los éxitos de la población. Si sustituimos M/N


por p en las fórmulas de E(X) = np y V(X) = np(1 − p), dadas en el teorema 3.5.8,
obtenemos
 
N−n
E(X) = np y V(X) = · np(1 − p).
N−1
La expresión anterior muestra que la esperanza de las variables binomial e hipergeométrica
son iguales, mientras que las varianzas de las dos variables difieren por el factor (N −
n)/(N − 1), a veces llamado factor de corrección por población finita. Este
factor es menor que 1, ası́ que la variable hipergeométrica tiene menor varianza que la
n 1
de la binomial. El factor de corrección se puede escribir como (1 − N )/(1 − N ), que es
aproximadamente 1 cuando la población tiene un tamaño muy grande (N → ∞). Una
regla de uso muy frecuente establece que el factor de corrección se puede pasar por alto
n
cuando N ≤ 0, 05, es decir, cuando la muestra contiene menos del 5% de los elemen-
tos de la población. Cuando esto sucede, las distribuciones binomial e hipergeométrica
coinciden.

✍ Ejercicios de la sección 3.7


65. Una caja con 24 calculadoras contiene 4 que están defectuosas. Si se eligen al azar 4 de
esa caja (sin reemplazo y sin importar el orden), ¿cuál es la probabilidad de que:
(a) tres estén defectuosas?
(b) a lo más una esté defectuosa?
(c) por lo menos dos estén defectuosas?
(d) Calcule la media, la varianza y la desviación estándar del número de calculadoras
defectuosas entre las 4 seleccionadas.
66. Se embarcan abanicos eléctricos en lotes de diez. Antes de aceptar un lote, un inspector
elige tres de esos abanicos y los inspecciona. Si ninguno de los abanicos probados está
defectuosos, el lote se acepta; si uno o más salen con defectos, revisan todo el lote.
Suponga que hay dos abanicos deficientes. ¿Cuál es la probabilidad de que se necesite un
100% de inspección?
67. En un almacén hay diez impresoras, de las cuales cuatro están defectuosas. Un cliente
selecciona, si reemplazo, cinco impresoras al azar. ¿Cuál es la probabilidad de que las
cinco estén en buen estado.
3.7 La distribución hipergeométrica 54

68. Se dispone de diez resistencias, entre las cuales se van a elegir tres sin reemplazo y sin
orden . Sea X la variable aleatoria que representa al número de resistencias defectuosas.
Construya la función de probabilidad de X con las siguientes condiciones:
(a) Hay dos resistencias, entre las diez, que son defectuosas.
(b) Entre las diez resistencias hay cuatro que son defectuosas.
69. Una empresa recibe un pedido de 20 artı́culos. Dado que la inspección de cada artı́culo
es cara, se sigue la polı́tica de analizar una muestra aleatoria de 6 artı́culos de cada envı́o,
aceptando la remesa si no hay más de un artı́culo defectuoso en la muestra. ¿Cuál es la
probabilidad de que sea aceptado un pedido con cinco artı́culos defectuosos?
70. Una empresa recibe un pedido de 1.000 artı́culos. Se analiza una muestra aleatoria de
15 artı́culos y se acepta el pedido si menos de tres resultan defectuosos. ¿Cuál es la
probabilidad de aceptar un envı́o que contenga un 5% de artı́culos defectuosos?
71. El rector de un colegio público está considerando la posibilidad de darle trabajo a nueve
personas que lo han solicitado. El perfil de todos los solicitantes es similar, excepto en
que cuatro son licenciados y el resto aún no lo es. Al final, el rector aprueba cinco
solicitudes. Si estas cinco solicitudes han sido elegidas aleatoriamente del total, ¿cuál es
la probabilidad de que menos de la mitad de las aprobadas sean solicitudes de personas
que son licenciados?
72. Una persona ha recibido una caja de 12 manzanas, de las cuales 5 son verdes y las otras
7, rojas. Supongamos que ella selecciona al azar 5 manzanas de la caja. ¿Cuál es la
probabilidad de que entre las 5 seleccionadas (a) hallan 2 manzanas rojas, (b) hallan por
lo menos 4 manzanas verdes, (c) no hallan manzanas rojas, (d) hallan a lo más 2 manzanas
verdes.
73. Cada uno de los 13 computadores de cierta marca ha sido devuelto a un proveedor de-
bido al mal funcionamiento de ciertos programas bajo un determinado sistema operativo.
Supongamos que 7 de estos 13 tienen problemas con la memoria RAM y los otros 6 tienen
problemas con los ejecutables EXE. Si se examinan al azar y sin reemplazo 6 de estos
computadores, ¿cuál es la probabilidad de que (a) exactamente 3, (b) a lo más 2, (c)
estrictamente entre 2 y 5 computadores tengan problemas con la memoria RAM?
74. En el dı́a de su cumpleaños, un joven recibió 5 discos compactos de música romántica y
4 de música clásica. Después de recibidos todos los discos compactos, los apiló en orden
aleatorio antes de comenzar a escucharlos. Considere los 3 primeros discos compactos que
ha escuchado Brian.
(a) ¿Cuál es la probabilidad de que exactamente 2 de ellos sean de música romántica?
(b) ¿Cuál es la probabilidad de que al menos 2 de ellos sean de música romántica?
(c) ¿Cuáles son el valor medio y la desviación estándar de la cantidad entre los 3, que
sean de música romántica?
(d) ¿Cuáles son el valor medio y la desviación estándar, del número de discos compactos
que no estén entre los 3 primeros y que sean de música romántica?
75. El jefe de personal de cierta empresa entrevista a 9 personas para cinco vacantes. Para
ello ha programado 5 entrevistas para el primer dı́a de entrevistas y 4 para el segundo dı́a.
Suponga que los candidatos son entrevistados al azar.
(a) ¿Cuál es la probabilidad de que k de los mejores cuatro candidatos sean entrevistados
el primer dı́a?
(b) ¿Cuántos de los mejores cuatro candidatos pueden esperar ser entrevistados el primer
dı́a?
3.8 Las distribuciones binomial negativa y geométrica 55

76. Una reunión polı́tica para discutir la aceptación de una reforma social terminó en discusión
debido a que ocho de los polı́ticos que participaron en la reunión estuvieron a favor la
reforma, mientras que los otros cuatro no lo estaban. Suponga que los polı́ticos que
participaron en la reunión salen de la oficina en orden aleatorio y que cada uno de los
cuatro primeros es abordado por un reportero para entrevistarlo.
(a) ¿Cuál es la función de probabilidad del número de los polı́ticos, entre los entrevistados,
a favor de la reforma?
(b) ¿Cuántos a favor de la reforma se espera que sean entrevistados?
77. Se selecciona al azar un comité de 3 personas entre 3 matemáticos y 5 fı́sicos.
(a) Encuentre la función de probabilidad para el número de matemáticos en el comité.
(b) Calcule la probabilidad de que en el comité hayan por lo menos dos fı́sicos.
78. Una señora siembra en el jardı́n de su casa 6 semillas seleccionadas al azar de una caja
que contiene tres semillas de nı́spero y cuatro de zapote. ¿Cuál es la probabilidad de que
entre las 6 semillas hayan dos de nı́spero?
79. Una determinada empresa está interesada en evaluar su procedimiento de inspección actual
en embarques de 50 artı́culos idénticos. El procedimiento es tomar una muestra de cinco
y pasar el embarque si no se encuentra más de dos defectuosos. ¿Qué proporción del 20%
de embarques defectuosos se aceptará?

3.8 Las distribuciones binomial negativa y geométrica


Experimento binomial negativo
Consideremos un experimento que satisface las mismas propiedades que las de un exper-
imento binomial, con la excepción de que los experimentos se repetirán hasta que ocurra
un número determinado de éxitos. Por lo tanto, en lugar de encontrar la probabilidad
de k éxitos en n experimentos, donde n es fijo, ahora estamos interesados en la proba-
bilidad de que el k-ésimo éxito ocurra en el r-ésimo experimento. Los experimentos de
esta clase recibe el nombre de experimentos binomiales negativos. En otras palabras, un
experimento binomial negativo con parámetros r y p está caracterizado por las
siguientes condiciones:

(BN1) El experimento consta de una serie de experimentos de Bernoulli y que son inde-
pendientes entre sı́.

(BN2) La probabilidad de éxito p de cada experimento de Bernoulli es siempre la misma.

(BN3) El experimento continúa hasta que un total de r éxitos se haya observado, siendo
r un entero no negativo dado.

Distribución binomial negativa


La variable de interés en un experimento binomial negativo con parámetros r y p es X =
“número de fracasos que preceden al r-ésimo éxito”. Obsérvese que X tiene valores 0,
1, 2, . . .. La distribución de probabilidad de X, llamada distribución binomial negativa,
depende de los parámetros r y p y la probabilidad que inicialmente nos interesa estudiar
3.8 Las distribuciones binomial negativa y geométrica 56

es la de obtener k fracasos antes del r-ésimo éxito, la cual simbolizaremos con bn(k; r; p).
Es decir, estaremos interesados en calcular la probabilidad

P(X = k) = bn(k; r; p),

cuya fórmula deduciremos a continuación. Obsérvese que el evento {X = k} es equiva-


lente9 al evento “r − 1 éxitos en los primeros k + r − 1 experimentos y un éxito en en
(k + r)-ésimo experimento”. Sean A y E los eventos que representan a “r − 1 éxitos en
los primeros k + r − 1 experimentos” y “ un éxito en en (k + r)-ésimo experimento”,
respectivamente. Con esto, el evento {X = k} es equivalente al evento A ∩ E. Como
todos los experimentos son independientes (y, por lo tanto, también A y E), entonces,

bn(k; r, p) = P(X = k) = P(A ∩ E) = P(A) P(E).

Ahora, debido a que p = P(E) y a que la probabilidad


 
k + r − 1 r−1
P(A) = b(r − 1; k + r − 1, p) = p (1 − p)k
r−1
es una probabilidad binomial con parámetros k + r − 1 y p, entonces,
   
k + r − 1 r−1 k+r−1 r
bn(k; r, p) = p (1 − p)k p = p (1 − p)k.
r−1 r−1
Esto conduce al siguiente teorema:

Teorema 3.8.1 Sea X el número de fracasos que preceden al r-ésimo éxito en un


experimento binomial negativo con parámetros r y p. Entonces, la probabilidad de
que hayan k fracasos antes del r-ésimo éxito está dada por
 
k+r−1 r
bn(k; r, p) = P(X = k) = p (1 − p)k, k = 0, 1, 2, . . . .
r−1

La correspondiente distribución de X se conoce con el nombre de distribución


binomial negativa con parámetros r y p.

Las funciones de probabilidad f y de distribución F de una variable aleatoria X que tiene


distribución binomial negativa con parámetros r y p están dadas por
 k+r−1 r
 r−1 p (1 − p)k, si k = 0, 1, 2, . . .;
bn(k; r, p) := f(k) =

0, de otra manera.
y X
Bn(t; r, p) := F(t) = P(X ≤ t) = bn(k; r, p),
k≤t

respectivamente, en donde la suma anterior recorre todos los enteros no negativos que
son menores o iguales que t.
9
Por ejemplo, si r = 6 y k = 13, entonces, debe haber 4 éxitos en los primeros 18 experimentos
y el experimento 19 debe ser 1 éxito.
3.8 Las distribuciones binomial negativa y geométrica 57

Ejemplo 3.8.2 Una pareja desea tener exactamente dos niñas en su familia. Tendrán hijos
hasta que se satisfaga esta condición. Suponiendo que la probabilidad de que el hijo que
nazca varón es igual a 0,5,
(a) ¿cuál es la probabilidad de que la familia tenga k hijos varones?
(b) ¿Cuál es la probabilidad de que la familia tenga 4 hijos?
(c) ¿Cuál es la probabilidad de que la familia tenga a lo más 4 hijos?
SOLUCION:
Sea X la variable aleatoria que representa a “número de varones que nacen antes de que
nazca la segunda hembra”. Es claro ver que X tiene distribución binomial negativa con los
parámetros r = 2 y p = 0, 5.

(a) Por el teorema 3.8.1, la probabilidad pedida es


 
k+1
P(X = k) = bn(k; 2; 0, 5) = (0, 5)2 (0, 5)k = (k + 1) (0, 5)k+2 .
1

(b) Nos piden calcular P(X = 2), la cual, por la parte (a), es igual a

P(X = 2) = (2 + 1)(0, 5)2+2 = 3(0, 5)4 = 0, 188.

Es decir, la probabilidad de que la familia tenga exactamente 4 hijos es aproximadamente


del 0,188.
(c) Nos piden calcular P(X ≤ 2), la cual, por la parte (a), es igual a

P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) = (0, 5)2 + 2(0, 5)3 + 3(0, 5)4 = 0, 688.

Es decir, la probabilidad de que la familia tenga a lo más 4 hijos es aproximadamente


del 0.688. ◭

Esperanza y varianza de la distribución binomial negativa


El siguiente teorema muestra cómo se puede calcular la esperanza y la varianza de una
variable aleatoria que tiene distribución binomial negativa.

Teorema 3.8.3 Si X es una variable aleatoria que tiene distribución binomial ne-
gativa con parámetros r y p, entonces, se cumple que

r(1 − p) r(1 − p)
E(X) = y V(X) = .
p p2

Ejemplo 3.8.4 Consideremos la situación presentada en el ejemplo 3.8.2.


(a) ¿Cuántos varones se esperarı́a que tenga esta familia?
(b) ¿Cuántos hijos se esperarı́a que tenga esta familia?
SOLUCION:
Sea X como en el ejemplo 3.8.2. En ese mismo ejemplo se determinó que X tiene distribución
binomial negativa con los parámetros r = 2 y p = 1.
3.8 Las distribuciones binomial negativa y geométrica 58

(a) Nos piden calcular la esperanza de X, la cual, por el teorema 3.8.3, está dada por

2(1 − 0, 5)
E(X) = = 2.
0, 5

(b) Aquı́ nos piden calcular la esperanza de X + 2. Por tanto,

E(X + 2) = E(X) + 2 = 4.

En conclusión, se espera que esta familia tenga 2 varones y un total de 4 hijos. ◭

Distribución geométrica
Como caso especial, la distribución binomial negativa con parámetros r = 1 y p se
conoce con el nombre de distribución geométrica con parámetro p. Como caso particu-
lar de los teoremas 3.8.1 y 3.8.3, con r = 1, tenemos el siguiente teorema:

Teorema 3.8.5 Sea X el número de fracasos que preceden al primer éxito en un


experimento binomial negativo con parámetros 1 y p. Entonces, la probabilidad de
que hayan k fracasos antes del primer éxito está dada por

P(X = k) = bn(k; 1, p) = p (1 − p)k, k = 0, 1, 2, . . . .

La correspondiente distribución de X se conoce con el nombre de distribución


geométrica con parámetros p. Además, E(X) = 1−p 1−p
p y V(X) = p2 .

Ejemplo 3.8.6 Las etiquetas en los frascos de los medicamentos se examinan con un lector
óptico para comprobar que están debidamente adheridas a las botellas. Suponga que la
probabilidad de descubrir una etiqueta mal adherida es 0,0001.
(a) Calcule la probabilidad de que el proceso detecte una etiqueta con tales caracterı́sticas
en el primer ensayo.
(b) Calcule la probabilidad de que el proceso descubra por primera vez una etiqueta mal
adherida en diezmilésima botella.
(c) Encuentre el valor esperado y la desviación estándar del número de etiquetas examinadas
hasta que se encuentra una etiqueta mal adherida.
SOLUCION:
Sea X es la variable aleatoria que representa al número de ensayos realizados antes de encon-
trar la primera etiqueta mal adherida. Dando por sentado que los ensayos son de Bernoulli,
con p := P(éxito) = 0, 0001, empleamos una distribución geométrica. Por consiguiente,
(a) P(X = 0) = p(1 − p)0 = p = 0, 0001.
(b) P(X = 10.000) = p(1 − p)10.000 = (0, 0001)(0, 9999)10.000 = 0, 0000368.
Observemos que, aun cuando esperamos una etiqueta mal adherida en cada 10.000 botellas,
la probabilidad de que en la siguiente botella se encuentre una de ellas es más alta que la
probabilidad de que se encuentre después de 10.000 botellas.
3.8 Las distribuciones binomial negativa y geométrica 59

(c) Tenemos que p = 0, 0001, de modo que E(X) = 1/(0, 0001) = 10.000. Es razonable
pensar que si una de cada 10.000 etiquetas está mal adherida, tendremos que esperar
un promedio de 10.000 botellas para encontrar una botella con tales caracterı́sticas.
La varianza es
1 − 0, 0001
V(Y) = = 99.990.000.
(0, 0001)2

Por lo tanto, la desviación estándar es 99.990.000 = 9.999, 5. ◭

✍ Ejercicios de la sección 3.8


80. El 10% de los motores armados en una fábrica de montaje están defectuosos. Si se
seleccionan en forma aleatoria uno por uno y se prueba, calcule la probabilidad de localizar
el tercer motor sin defecto (a) en el quinto ensayo,(b) en el quinto ensayo o antes.
81. De acuerdo con un estudio geológico, en un pozo de exploración petrolera hay 0,2 de pro-
babilidad de encontrar petróleo. Calcule la probabilidad de localizar petróleo por primera
vez en el tercer pozo que se perfore.
82. Nubia y Jorge deciden tener hijos hasta que tengan cuatro del mismo sexo. Si se supone
que la probabilidad de que nazca varón es de 0,5, ¿cuál es la función de probabilidad del
número de hijos de Nubia y Jorge?
83. Tres hermanos y sus respectivas esposas deciden tener hijos hasta que cada familia tenga
dos niñas.
(a) ¿Cuál es la función de probabilidad del número total de varones nacidos de los her-
manos?
(b) ¿Cuál es la esperanza del número total de varones nacidos de los hermanos y cómo
se compara con el número esperado de varones nacidos de cada hermano?
84. Encuentre la probabilidad de que una persona que lanza tres monedas obtenga sólo caras
o sellos por segunda vez en el sexto lanzamiento.
85. Se sabe que en cierto proceso de fabricación, en promedio, uno de cada 100 artı́culos está
defectuoso. ¿Cuál es la probabilidad de que el sexto artı́culo que se inspecciona sea el
primer defectuoso que se encuentra.
86. Si la probabilidad de que un ladrón sea atrapado en un robo cualquiera es 0,20. ¿Cuál es
la probabilidad de que lo capturen por primera vez en su cuarto robo?
87. Si 0,05 es la probabilidad de que cierto instrumento de medición sufra una desviación
excesiva, ¿cuál es la probabilidad de que el sexto de los instrumentos probados sea el
primero en mostrar esa desviación?
88. Un tirador experto da en el blanco el 95% de las veces. ¿Cuál es la probabilidad de que
falle por primera vez en su decimoquinto disparo?
89. Los expedientes de una compañı́a de albercas indican que la probabilidad de que una de
sus nuevas albercas requiera reparación en el plazo de un año es 0,20. ¿Cuál será la
probabilidad de que la sexta alberca construı́da en un año determinado sea la primera en
requerir reparación en ese lapso?
3.9 Uso de Statgraphics para trabajar con distribuciones discretas 60

3.9 Uso de Statgraphics para trabajar con distribuciones


discretas
Introducción
A través del programa Statgraphics se escoge una de las distribuciones que incluye el
programa y se introducen los valores de los parámetros de la distribución. El programa
permite calcular probabilidades para puntos en variables aleatorias discretas y para in-
tervalos en variables aleatorias discretas y continuas (en esta sección nos limitaremos
al caso discreto y en la sección ?? al caso continuo). Ası́ mismo, permite calcular
cuantiles o percentiles para ambos tipos de variables aleatorias. También representa
gráficamente las distribuciones de probabilidad. En esta sección se presenta en primer
lugar una descripción de las opciones para cálculo de probabilidades (en el caso discreto)
con Statgraphics, junto con algunos ejemplos.

Opciones de Statgraphics para probabilidad


• Se escoge la opción Plot de la barra de menú.

• Dentro de Plot, se escoge Probability Distributions.

• Dentro de Probability Distributions, se escoge la distribución deseada. Los valores


de los parámetros que definen la distribución (están fijados por defecto por el
programa) se pueden modificar pulsando el botón derecho del ratón y escogiendo
la opción Analysis Options.

Opciones numéricas
Situándose en el icono de Tabular options (de color amarillo) y pulsando el botón
izquierdo del ratón, el programa ofrece cuatro posibilidades:

• Analysis Summary (opción por defecto).


El programa presenta un recordatorio de la distribución escogida y los valores de
los parámetros.

• Cumulative Distribution Function (cálculo de probabilidad).


Dado un valor x de la variable aleatoria X, el programa calcula tres probabilidades:
P(X < x), P(X = x) y P(X > x). El valor x se introduce pulsando el botón derecho
del ratón, escogiendo Pane Options y rellenando o modificando uno (o varios) de
los recuadros blancos que aparecen mediante el teclado.

• Inverse CDF (cálculo de percentiles o cuantiles).


Dado un valor de probabilidad p, el programa calcula el valor x tal que F(x) = p.
El valor de p se introduce pulsando el botón derecho del ratón, escogiendo Pane
Options y rellenando o modificando uno (o varios) de los recuadros blancos que
aparecen.

• Random Numbers (generación de números aleatorios).


El programa genera n valores aleatorios de una distribución elegida. El valor de n
3.9 Uso de Statgraphics para trabajar con distribuciones discretas 61

se fija pulsando el botón derecho del ratón, escogiendo Pane Options y escribiendo
en la opción Size el valor deseado. A continuación, para generar la serie de números
aleatorios, hay que situarse en el ı́cono Save results (cuarto ı́cono, el que lleva un
dibujo de un diskette) y pulsar el botón izquierdo del ratón. El programa permite
guardar los valores generados (marcando el recuadro bajo el tı́tulo Save con el
botón izquierdo del ratón) y pide al usuario que escoja un nombre para la variable
bajo la cual se almacena la columna de datos (por defecto, las denomina RAND1,
RAND2, etc,..., aunque el usuario puede cambiarlas situando el cursor encima de
cualquiera de ellas en los recuadros bajo el tı́tulo target variables y moidificando
el texto mediante el teclado). Se pueden generar muestras secuencialmente con
rapidez sin más que pinchar en el cuarto icono y cambiar el nombre de la variable
(RAND1, RAND2,...).

Opciones gráficas
Las opciones gráficas se seleccionan pulsando el icono Graphical Options (tercer icono,
en el que aparece una gráfica) de la barra de herramientas con el botón izquierdo del
ratón. El programa ofrece cinco posibilidades, a saber:

• Density/Mass Function.
Esta opción crea una gráfica de la función de probabilidad (o de densidad en el
caso continuo) que se está evaluando.

• CDF : Esta opción crea una gráfica de la función de distribucion acumulada que
se está evaluando.

• Survivor Function: Esta opción crea una gráfica de la función complementaria


de la función de distribución acumulada (función de supervivencia) que se está
evaluando. La función indica la probabilidad de obtener un valor mayor o igual a
los valores sobre el eje X.

• Log Survivor Function: Esta opción crea una gráfica de la logaritmo de la función
de supervivencia que se está evaluando. La función de supervivencia indica
la probabilidad de obtener un valor mayor o igual a los valores sobre el eje X.

• Hazard Function: Esta opción crea un gráfica de la función de riesgo para la


distribución que se está evaluando. La función de riesgo es igual a la función
de probabilidad (o de densidad en el caso continuo) dividida por la función de
supervivencia.

Ejemplo 3.9.1 El porcentaje de piezas defectuosas producidas en un proceso es del 5%.


Calcular la probabilidad de que de 150 piezas producidas mediante el proceso en cuestion
hayan como máximo seis defectuosas.
SOLUCION:
Se eligen las opciones Plot, a continuación Probability Distributions y seguidamente se
escoge la distribución binomial. Marcando en el ı́cono Input dialog (primer ı́cono, rojo) se
podrı́a posteriormente cambiar de tipo de distribución en el mismo análisis. Pulsando el
botón derecho del ratón y escogiendo Analysis Options, se fija el valor de n (Trials) en 150
y el de p (Event probability) en 0,05. Pulsando en el ı́cono Tabular Options (segundo ı́cono,
amarillo) se escoge CDF. Pulsando otra vez el botón derecho del ratón y escogiendo ahora
Cap. 3. Ejercicios complementarios 62

Pane Options, se fija elige el valor de la variable (Random variable) en 6. La solución que
da el programa es 1 − F(6) (Upper tail area) = 0, 627. Es decir, F(6) = 0.373. ◭

✍ Ejercicios de la sección 3.9


s 90. Un agente de seguros vende pólizas a 5 individuos, todos de la misma edad. De acuerdo
con las tablas actuariales, la probabilidad de que un individuo con esa edad viva 30 años
más es de 3/5. Determinar la probabilidad de que dentro de años vivan (a) los 5 individuos,
(b) al menos 3, (c) sólo 2, (d) al menos 1.
s 91. Se ha producido un vertido de productos radiactivos en una zona A; se detectará la
contaminación sólo en los puntos en que se supere un total de 30 desintegraciónes en un
minuto. Si en un punto el número de desintegraciones por minuto sigue una distribución de
Poisson con media 33, calcular la probabilidad de que al cabo de un minuto sea detectada
la contaminación en ese punto.
s 92. En el primer curso de una facultad hay cinco asignaturas y se permite pasar al segundo
curso a todos los alumnos que hayan aprobado un mı́nimo de 3 asignaturas. Si la proba-
bilidad de aprobar cada asignatura es del 60%, ¿cuál es la de pasar a segundo curso?
s 93. El número medio de automóviles que llega a una estación de suministro de gasolina es
de 210 por hora. Si dicha estación puede atender a un máximo de 10 automóviles por
minuto, determinar la probabilidad de que en un minuto dado lleguen a la estación de
suministro más automóviles de los que puede atender.
s 94. En la Unidad de Cuidados Intensivos de un hospital hay 30 camas. Si el número de
enfermos graves que llegan al hospital por dı́a sigue una distribución de Poisson con
media 20, ¿cuál es la probabilidad de que en un dı́a falten camas en la unidad?
s 95. Un equipo de seis médicos se turna para hacer las guardias. Si la probabilidad de causar
baja para cada uno de ellos en un periodo de dos meses es de 0,1 y la baja de un facultativo
es independiente de las de los demás, ¿cuál es la probabilidad de que haya que suplir al
menos a uno de ellos en dicho perı́odo?

✍ Ejercicios complementarios
96. ¿Son las siguientes afirmaciones verdaderas o falsas? Justificar cada respuesta.
(a) Toda variable aleatoria discreta es un número.
(b) Si f es la función de probabilidad de una variable aleatoria discreta X y 0 es un posible
valor de X, entonces, f(0) = 0.
(c) Para cualquier variable aleatoria discreta X se cumple que P(X = 1) = 1, en donde 1
es un posible valor de X.
(d) Si F es la función de distribución acumulada de una variable aleatoria X discreta,
entonces, F es una función escalonada
(e) Si X es una variable aleatoria discreta con función de distribución acumulada F, en-
tonces, se cumple que P(3 ≤ X < 5) = F(5) − F(3).
(f) Si X es cualquier varaible aleatoria discreta, entonces, la desviación estándar de la
variable aleatoria X + 2 es diferente a la desviación estándar de X.
(g) Si X es cualquier variable aleatoria discreta y si la variable aleatoria X + 2 tiene
esperanza 1, entonces, la esperanza de X es 3.
Cap. 3. Ejercicios complementarios 63

97. Dos dados no cargados se tiran independientemente. Sea X la variable aleatoria que
representa al máximo número que resulta en ambas caras.
(a) Halle la función de probabilidad f de X.
(b) Halle la función de distribución acumulada F de X y represéntela gráficamente.
98. Una caja contiene cuatro tornillos de cuerda derecha y seis de cuerda izquierda. Se
seleccionan dos tornillos (uno por uno). Sea X la variable aleatoria que representa al
número de tornillos de cuerda izquierda que se obtienen.
(a) Si la selección es sin reemplazo, construya la función de probabilidad y grafı́quela;
construya la función de distribución acumulada y grafı́quela; calcule la media e in-
terprétela y calcule la varianza. ¿Qué tipo de experimento aleatorio es este? ¿Por
qué?
(b) Si la selección es con reemplazo, construya la función de probabilidad y grafı́quela;
construya la función de distribución acumulada y grafı́quela; calcule la media e in-
terprétela y calcule la varianza. ¿Qué tipo de experimento aleatorio es éste? ¿Por
qué?
99. Una determinada revista, que evalúa la calidad del funcionamiento de computadores
nuevos, reporta regularmente el número de defectos importantes que tiene cada com-
putador en cada examen. Sea X la variable aleatoria que representa al número de defectos
importantes en un computador de cierto tipo seleccionado al azar. Supongamos que la
función de distribución acumulada F de X es como sigue:


 0, si t < 0,




 0, 18, si 0 ≤ t < 1,

0, 39, si 1 ≤ t < 2,
F(t) =


 0, 63, si 2 ≤ t < 3,


0, 89, si 3 ≤ t < 4,



1, si 4 ≤ t.

(a) Calcule la probabilidad de que el número de defectos importantes en un computador


de cierto tipo seleccionado al azar sea igual a 1.
(b) Calcule la probabilidad de que el número de defectos importantes en un computador
de cierto tipo seleccionado al azar sea estrictamente mayor que 2.
(c) Calcule la probabilidad de que el número de defectos importantes en un computador
de cierto tipo seleccionado al azar sea mayor o igual que 2, pero menor o igual que 4.
(d) Calcule la probabilidad de que el número de defectos importantes en un computador
de cierto tipo seleccionado al azar sea estrictamente mayor que 1 y estrictamente
menor que 4.
(e) Halle la función de probabilidad f de X.
(f) Utilizando f, encuentre las probabilidades de los incisos (a) hasta (d).

100. La probabilidad de que una persona, que vive en cierta ciudad de Colombia, tenga un gato
es de 0,6. Encuentre la probabilidad de que la undécima persona entrevistada al azar en
esta ciudad sea la cuarta que tiene un gato.
101. Un empresario necesita conocer algunos detalles sobre el proyecto financiero que debe
presentar ante el consejo directivo el próximo martes y decide llamar por teléfono a los
compañeros que hacen parte del proyecto para preguntarles. Cree que, en cada llamada,
la probabilidad de obtener la información necesaria es 0,30. Decide seguir llamando a sus
compañeros hasta que consiga la información. Sea X la variable aleatoria que representa
el número de llamadas necesarias para obtener la información.
Cap. 3. Ejercicios complementarios 64

(a) Construya y grafique la función de probabilidad de X.


(b) Construya y grafique la función de distribución acumulada de X.
(c) Calcule la probabilidad de que se necesiten al menos tres llamadas.

102. Sea X la variable aleatoria que representa al número de llamadas telefónicas que recibe
un conmutador durante un intervalo de cinco minutos. Supongamos que X tiene función
de probabilidad
e−3 3x
f(x) = , para x = 0, 1, 2, . . . .
x!
(a) Determine la probabilidad de que X sea igual a 0, 1, 2, 3 y 4.
(b) Grafique la función de probabilidad de X para estos valores de x.

103. Una persona en Alemania puede repetir su examen de conducción tantas veces lo quiera
hasta que lo gane para poder recibir su permiso de conducción. Supongamos que la prob-
abilidad de que una determinada persona en Alemania apruebe su examen de conducción
es 0,7. Determine la probabilidad de que esa persona apruebe el examen de conducción
(a) en el tercer, (b) antes del cuarto intento.
104. Suponga que un distribuidor de monedas antiguas se interesa en la compra de una moneda
de oro para el que las probabilidades 0,31, 0,26; 0,25 y 0,18 son las de que pueda venderlo
con una ganancia de $500.000; una ganancia de $300.000; venderlo al costo; o venderlo
con una pérdida de $300.000. ¿Cuál es su ganancia esperada? Interprete su respuesta.
105. Una persona tiene la opción de seleccionar dos temas (la dieta y el asma) para proponer
un reportaje en un periódico local. Si elige el tema la dieta pedirá dos libros por medio
de préstamos entre bibliotecas, pero si selecciona el tema del asma pedirá cuatro libros.
La persona cree que, para un buen reportaje, necesita por lo menos la mitad de los libros
solicitados para cualquiera de los temas seleccionados. Si la probabilidad de que un libro
solicitado por medio de préstamo entre bibliotecas en realidad llegue a tiempo es 0,9 y los
libros llegan independientemente unos de otros,
(a) ¿cuál tema debe seleccionar la persona para llevar al máximo la probabilidad de hacer
un buen reportaje?
(b) ¿Cuál si la probabilidad de llegada es sólo 0,5 en lugar de 0,9 ?
106. De todos los clientes que compran computadores portátiles, 75% compran uno con 256 MB
de memoria RAM. Sea X el número entre los siguientes 10 compradores que seleccionan
un computador portatil con 256 MB de memoria RAM.
(a) ¿Cuál es la función de probabilidad de X?
(b) ¿Cuál es la probabilidad de que el número entre los siguientes 10 compradores que
seleccionan un computador portatil con 256 MB de memoria RAM sea mayor o igual
que 7? ¿Esté entre 6 y 13 (ambos inclusive)?
(c) Calcule la esperanza y desviación del número entre los siguientes 10 compradores que
seleccionan un computador portatil con 256 MB de memoria RAM. Interprete sus
respuestas.
(d) Si la tienda tienda actualmente tiene en existencia 8 portátiles con 256 MB de memoria
RAM y 7 con 300 MB de memoria RAM, ¿cuál es la probabilidad de que todas las
solicitudes de estos 10 clientes puedan satisfacerse con la existencia actual?
107. El número de llamadas telefónicas recibidas en una determinada oficina para formular una
queja es un proceso de Poisson con razón α = 4 por hora.
Cap. 3. Ejercicios complementarios 65

(a) Calcule la probabilidad de que exactamente 10 llamadas telefónicas se reciban durante


un periodo en particular de dos horas.
(b) Si los empleados que reciben las llamadas en la central descansan 30 minutos para
tomar alimentos, ¿cuál es la probabilidad de que no se pierda ninguna llamada de
asistencia?
(c) ¿Cuántas llamadas se esperarı́an durante el descanso?
108. En una maratón de atletismo, la probabilidad de que un atleta termine la carrera es 0,99.
Suponga que una maratón comienza siempre con 400 atletas.
(a) ¿Cuántos atletas se esperan que terminen la carrera y cuál es la desviación estándar
del número que se espera que no terminen la carrera?
(b) ¿Cuál es la probabilidad (aproximada) de que por lo menos cuatro atletas no terminen
la carrera?
109. Un determinado pelotón militar tiene disponibles 3 soldados de Alemania, 5 de Colombia,
4 de Japón y 7 de Venezuela. Si se seleccionan a 8 de estos soldados para una exploración
militar, encuentre la probabilidad de que hayan 2 soldados de Alemania, 2 de Colombia,
3 de Japón y 1 de Venezuela.
110. Suponga que la probabilidad de que, al ser revisado, un soldado tenga sus botas comple-
tamente limpias sea de 0,7. ¿Cuál es la probabilidad de que
(a) el quinto soldado revisado sea el tercero en tener sus botas completamente limpias?
(b) el cuarto soldado revisado sea el primero en tener sus botas completamente limpias.
111. Un tienda de deportes generalmente compra lotes grande de cierta marca de balones de
fútbol. Se utiliza un método que rechaza un lote si se encuentran dos o más unidades
defectuosas en una muestra aleatoria de 25 unidades.
(a) ¿Cuál es la probabilidad de rechazar un lote que tiene 5% de unidades defectuosas?
(b) ¿Cuál es la probabilidad de aceptar un lote que tiene 10% de unidades defectuosas?
112. Una encuesta a nivel nacional, hecha por cierta universidad a los estudiantes de undécimo
grado, revela que aproximadamente el 80% no tienen computador en su casa. Si se
seleccionan al azar 15 de estos estudiantes y se les hace la encuesta, ¿cuál es la probabilidad
de que más de cinco pero menos de once tengan computador en su casa?
113. El número de personas que llegan por hora a cierta tienda se supone que tiene distribución
de Poisson con λ = 5.
(a) ¿Cuál es la probabilidad de que más de 7 personas lleguen en un perı́odo de dos horas?
(b) ¿Cuál es el número medio de llegadas durante un perı́odo de dos horas?
114. La probabilidad de que una persona muera cuando contrae una infección pulmonar es
0,003. De los siguientes 4.000 infectados con este tipo de enfermedad, ¿cuál es el número
medio que morirá?
115. Si el espacio muestral Ω es un conjunto infinito, ¿implica esto necesariamente que cualquier
variable aleatoria X definida sobre Ω tendrá un conjunto infinito de valores posibles? Si
es ası́, diga por qué. Si no, dé un ejemplo.
116. Suponga que el número de plantas de un tipo particular se encuentra en una región
rectangular de cierta área geográfica es una variable aleatoria X con función de probabilidad

c/x3 , si x = 1, 2, 3, . . .,
f(x) =
0, de otro modo.
Cap. 3. Ejercicios complementarios 66

Halle c para que f sea en realidad una función de probabilidad. ¿Es E(X) finita? Justifique
su respuesta.
117. Encuentre la esperanza y varianza de una variable X si ésta se define de modo que

E([X − 2]2 ) = 5, E([X − 4]2 ) = 5.

118. Suponga que E(X) = 5 y E(X[X − 1]) = 27, 5. Calcule E(X2 ) y V(X).
⋆ 119. Demuestre que la función de distribución acumulada F de una variable aleatoria discreta
X es una función no decreciente, es decir, si x1 < x2 , entonces, F(x1 ) ≤ F(x2 ). ¿En qué
condición será F(x1 ) = F(x2 )?
⋆ 120. Demuestre que E(aX + b) = aE(X) + b y V(aX + b) = a2 .
⋆ 121. Para n fija, ¿hay valores de p con 0 ≤ p ≤ 1 para los cuales V(X) = 0. ¿Para qué valor
de p es V(X) es máxima? Explique.
⋆ 122. Si X es una variable aleatoria binomial con parámetros n y p, demuestre que E(X) = np
y V(X) = np(1 − p).
⋆ 123. Si X tiene distribución hipergeométrica con parámetros n, M y N, demuestre que E(X) =
M N−n M M

n· N y V(X) = N−1 ·n· N · 1− N .
⋆ 124. Si X tiene distribución de Poisson con parámetro λ, demuestre que E(X) = V(X) = λ.
Respuestas a ejercicios impares
seleccionados

Capı́tulo 3

7. (a) 1/37 (b) 1/31 35. (a) 0,2612736 (b) 0,6561 (c) 0,104
(d) 0,9897462
9. (a) 0,55 (b) 0,70 (c) 0,45 (d) 0,34 (e)
0,70 (f) 0,45 37. (a) 0,10689 (b) 0,295652 (c) 9,5128
×10−7 (d) 0,6637
11. (b) f(k) = k2 2−k
 3 
/10, con
39. (b) 0,6528 (c) 0,92224 (d) 2; 1,2
k = 0, 1, 2
41. No
13. (a) 0,47 (b) 0,70 (d) 0,41 (e) 0,31
43. (a) 0,984 (b) 0 (c) 0,075 (d) 0,358
15. (c) 15/28 (d) 45/56 (e) 1; 0,9746
17. f(k) = (k − 1)(0, 05)k−2 (0, 95)2 , para 45. (a) 0,127 (b) 0,463 (c) 0,91
k = 2, 3, 4, 5, . . . 47. (a) 0,9891 (b) 0,5798
19. (c) 1,93; 2,6830 49. (a) 0,02857 (b) 0,0767
51. 0,834
21. (a) 25,55; 669,75; 16,9472 (b) 380,25;
254,208 (c) 644,2 53. (a) 0,070 (b) 0,033 (c) 0,93 (d) 0,177
(e) 0,036
23. 1
55. (a) 0,195 (b) 0,352 (c) 0,982 (d)
25. $2.430.451 0,238
27. (c) 0,72 (d) 2,21; 1,235 57. (a) 0,168 (b) 0,392 (c) 0,647 (d)
0,353
29. (c) 0,66 (d) 9,33; 2,0152 (e) 1.981,34
59. (a) 10; 3,16227 (b) 0,542 (c) 0
pesos
61. (a) 0,091; 0,90; 0,283 (b) 12; 3,464
31. 27,5; 56,25 (c) 0,53; 0,011
33. 8; 60,7 63. (a) 0,1429 (b) 0,1353
Respuestas a ejercicios impares seleccionados 68

65. (a) 0,006023 (b) 0,38208 (c) 0,61792 87. 0,038689


(d) 0,67; 0,6947
89. 0,000256
67. 0,0238
99. (a) 0,21 (b) 0,37 (c) 0,61 (d) 0,50
69. 0,516 101. (a) f(k) = (0, 30)(0, 70)k−1 , con
71. 0,4762 k = 1, 2, 3, . . . (b) F(t) = 1 − (0, 70)t si
t = 1, 2, 3, . . .; F(t) = 0, de otra forma
73. (a) 0,408 (b) 0,20862 (c) 0,71387 (c) 0,657
75. (a) f(k) = k4 5−k
 5 
/126, con 103. (a) 0,0630 (b) 0,9730
k = 0, 1, 2, 3, 4, 5 (b) 20/9
105. (a) El asma (b) La dieta
77. (a) f(k) = k3 4−k
 4 
/56, con
k = 0, 1, 2, 3, 4 (b) 8/3 107. (a) 0,099 (b) 0,135 (c) 2

79. 0,9517 109. 0,011114

81. 0,128 111. (a) 0,358 (b) 0,271


113. (a) 0,133 (b) 10
83. (a) f(k) = k+5 6+k

5 (0, 5) , con
k = 0, 1, 2, . . . (b) 6 115. No
85. 0,0095099 117. 3; 4
Indice

Conjunto Proceso de Poisson, 39


enumerable, 4
Regla
Desviación de Tchevichev, 26
estándar empı́rica, 26
de una función, 25
de una variable aleatoria, 23 Teorema
Distribución de aproximación
binomial, 33 de la binomial a la de Poisson, 43
binomial negativa, 56
de Poisson, 40 Valor esperado, ver esperanza
geométrica, 58 Variable aleatoria, 3
hipergeométrica, 51 continua, 4
uniforme (discreta), 29 discreta, 4
Varianza
Esperanza de una función, 25
de una función, 21 de una variable aleatoria, 23
de una variable aleatoria, 18
Experimento
binomial, 31
binomial negativo, 55
de Bernoulli, 30
de Poisson, 39
hipergeométrico, 48

Factor de corrección
por población finita, 53
Función de
distribución acumulada, 10
probabilidad, 7
riesgo, 61
supervivencia, 61

Media
de una función, 21
de una variable aleatoria, 18

También podría gustarte