Probabilidad Estadistica

PROBABILIDAD
introducción a la inferencia estadística

VLADIMIR MORENO G.
PONTIFICIA UNIVERSIDAD JAVERIANA
2021
Vladimir Moreno G.
R
∑
PROBABILIDAD
Introducción inferencia estadística
JAVERGRAF
Pontificia Universidad Javeriana
(https://ciencias.javeriana.edu.co/departamentos-instituto/matematicas).
JAVERGRAF
Derechos reservados © 2021 Ediciones Universidad Javeriana
https://www.javeriana.edu.co/puj/viceadm/dsu/javegraf/
Photos by: Paola alejandra Moreno. Laguna de Tota, Boyacá, Colombia.
Licencia Creative Commons Reconocimiento - No Comercial 3.0 Unported Licence (la “Licencia”).
Usted puede utilizar este archivo de conformidad con la Licencia. Usted puede obtener una copia de
la Licencia en http://creativecommons.org/licenses/by-nc/3.0. A menos que lo requiera
la ley aplicable o se acuerde por escrito, el software distribuido bajo la Licencia se distribuye “tal y
como está”, sin garantías ni condiciones de ningún tipo, ya sea expresa o implícita.
Primera edición, mayo 2021

Índice general
1 Espacios muestrales y eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.1 Elementos de conjuntos 7
1.2 Técnicas de Conteo 12
1.2.1 Principios fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.2 Muestras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2 Espacio de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.1 Espacios medibles 23
2.1.1 σ − Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2 Espacio de Probabilidad 27
2.3 Probabilidad condicional e independencia 36
2.4 Probabilidades totales y regla de Bayes 43
2.5 Independencia 48
3 Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.1 Distribución de variables aleatorias 53
3.2 Medidas estadísticas de resumen 60
4 Modelos discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.1 Modelo uniforme discreto 65
4.2 Modelo Bernoulli 67
4.3 Modelos binomial 68
4.4 Modelo geométrico 75
4.5 Modelo binomial negativo 81
4.6 MODELO HIPERGEOMÉTRICO 87
4.7 MODELO POISSON 95
5 Modelos continuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

5.1 Modelo uniforme 105
5.2 Modelo exponencial 109
5.3 Modelo gamma 114
5.3.1 Función Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
5.3.2 Distribución Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
5.4 Modelo Weibull 117
5.5 Modelo Beta 119
5.6 Modelo normal 119
6 Modelos aleatorios bivariados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

6.1 Bivariadas discretas 125
6.2 Bivariadas continuas 131
6.3 Distribuciones condicionales e independencia 134
6.4 Independencia, covarianza y correlación 140
7 Transformación de variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . 161

7.1 Transformación de una variable aleatoria 162
7.2 Transformación de dos variables aleatorias 170
Elementos de conjuntos
Técnicas de Conteo
Principios fundamentales
Muestras
1 — Espacios muestrales y eventos
1.1 Elementos de conjuntos
Definición 1.1
Un conjunto es una colección bien definida de objetos. Por bien definida entendemos que es
posible determinar con precisión si un elemento pertenece o no al conjunto.
Si un objeto hace parte de un conjunto diremos que es un elemento de este conjunto.
N Existen dos maneras de representar un conjunto: listando todos y cada uno de los elementos
del conjunto o bien describiendo de manera precisa la propiedad que define el ser elemento de
este conjunto. El primer método se denomina extensión y el segundo comprensión.
1.1
Consideremos el conjunto A de todas las vocales del alfabeto en español; éste conjunto puede
definirse por:
X Extensión: {a, e, i, o, u}
X O bien por comprensión: V = {x ∈ Ω : x es una vocal}
siendo Ω la colección de todas las letras que componen el alfabeto español.
El símbolo ‘∈’ es el de pertenencia y se lee pertenece, por ejemplo u ∈ V , donde V es el conjunto de

vocales del alfabeto español.
Para definir un conjunto debemos asumir que tenemos un conjunto referencial, del cual seleccionar
los elementos que satisfarán la condición que determinará el conjunto. En el ejemplo anterior este
conjunto referencial corresponde a las letras del alfabeto español.
N Sea Ω el conjunto referencial y A un conjunto definido en Ω.

8 Espacios muestrales y eventos
• Si x es un elemento de A, entonces escribiremos x ∈ A.

• Si x no es un elemento de A, entonces escribiremos x ∈
/A
Dos conjuntos son comparables mediante la relación de contenencia.
Definición 1.2
Sean A y B dos conjuntos del conjunto referencial Ω.
a) A es un subconjunto de B, A ⊆ B, cuando cada elemento de A también es un elemento
de B.
b) A y B son iguales, A = B, si y solamente si A ⊆ B y B ⊆ A.
N
X El conjunto que no tiene elementos se llama conjunto vacio, se denota con 0.
/
X 0/ es subconjunto de cualquier conjunto.
1.2
Sea D = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, el conjunto de los dígitos. Los conjuntos P = {0, 2, 4, 6, 8}

dígitos pares, I = {1, 3, 5, 7, 9} dígitos impares, son subconjuntos de D, P e I no tienen
elementos en común, diremos que P e I son disyuntos.
Definición 1.3
Sean A y B dos conjuntos del conjunto referencial Ω.
• El conjunto constituido por los elementos que pertenecen tanto al conjunto A como al
conjunto B se llama el conjunto intersección de A con B y se simboliza A ∩ B, es decir
A ∩ B = {x ∈ Ω : x ∈ A y x ∈ B}
• El conjunto constituido por los elementos que pertenecen al conjunto A o al conjunto B,

o bien a ambos conjuntos, se llama el conjunto unión de A con B y se simboliza A ∪ B,
es decir
A ∪ B = {x ∈ Ω : x ∈ A o x ∈ B}
Definición 1.4
Los eventos A y B son mutuamente excluyentes, disyuntos o ajenos sí A ∩ B = 0/
N ˙
Cuando los conjuntos A y B son disyuntos, la unión de estos se escribirá A + B o bien A∪B
Es posible definir otras operaciones entre conjuntos, como la intersección y la unión.

Definición 1.5
Sean A y B conjuntos de un conjunto referencial Ω.
• El conjunto constituido por todos los elementos de A que no están en el conjunto B es
el conjunto diferencia de A con B, A − B, y se define formalmente por:
A − B = {x ∈ Ω : x ∈ A, x ∈
/ B}
• El conjunto diferencia de Ω con A, Ω − A se llama el complemento de A y se simboliza

por Ac , y está constituido por todos los elementos en Ω que no están en A, es decir:
Ac = {x ∈ Ω : x ∈
/ A}
• El producto cartesiano de los conjuntos A y B es un subconjunto del espacio referencial

Ω × Ω y está definido de la siguiente manera:
A × B := {(x, y) ∈ Ω × Ω : x ∈ A, y ∈ B}
Definición 1.6
Sea f : X −→ Y , una función entre los conjuntos X y Y . Sean A ⊆ X, B ⊆ Y .
a) El conjunto f (A) := { f (a) : a ∈ A} es la imagen directa, o imagen, de A bajo f .
b) El conjunto f −1 (B) := {x ∈ X : f (x) ∈ B} es la imagen inversa de B bajo f .
1.3
a) Si f (x) = x2 entonces
X f ([0, 3]) = [0, 9]
X f ([−1, 3]) = [0, 9]
X f −1 ({4}) = {−2, 2}
X f −1 ([0, +∞)) = R
b) Si f (x) = sin x entonces
X f ({nπ : n ∈ Z}) = {0}
X f ({nπ + π2 : n ∈ Z}) = {−1, 1}
X f −1 ([0, 1]) = n∈Z [2nπ, (2n + 1)π]
S
En la proposición siguiente, resumimos algunas de las propiedades más relevantes de las imagenes
directas e inversas bajo una función con las operaciones de unión, intersección y diferencia.
Proposición 1.1
Sea f : X −→ Y , una función.
a) f (A ∪ B) = f (A) ∪ f (B), para todo A, B ⊆ X.
b) f (A ∩ B) ⊆ f (A) ∩ f (B), para todo A, B ⊆ X.
c) f (A ∩ B) = f (A) ∩ f (B), para todo A, B ⊆ X, si y solamente si f es inyectiva.
d) f (A − B) ⊇ f (A) − f (B), para todo A, B ⊆ X.
e) f (A − B) ⊇ f (A) − f (B), para todo A, B ⊆ X, si y solamente si f es inyectiva.

f) f −1 (M ∪ N) = f −1 (M) ∪ f −1 (N), para todo M, N ⊆ Y .
g) f −1 (M ∩ N) = f −1 (M) ∩ f −1 (N), para todo M, N ⊆ Y .
h) f −1 (M − N) = f −1 (M) − f −1 (N), para todo M, N ⊆ Y .
N Intuitivamente la cardinalidad de un conjunto corresponde al número de elementos que éste

tiene; siendo aceptable esta idea para conjuntos finitos no resulta evidente para conjunto con
un número infinito de elementos.
Definición 1.7
La cardinalidad del conjunto vacío, 0,
/ es 0.
Definición 1.8
Sean A y B dos conjuntos no vacíos. A y B tienen la misma cardinalidad si y solamente si
existe una aplicación biyectiva entre A y B.
N Dado n ∈ N, n ≥ 1, denotamos con Zn el conjunto {1, 2, 3, . . . , n}
Definición 1.9
Sea A un conjunto. El conjunto A es finito si y solamente si A = 0/ o bien existe una función
biyectiva entre A y Zn para algún n ∈ N, n ≥ 1. En este caso diremos que A tiene n elementos,
y denotaremos #(A) al número de elementos de A, en particular #(0) / := 0.
Definición 1.10
Un conjunto A es enumerable si y solamente si existe una aplicación biyectiva entre Z+ y A.
1.4
a) El conjunto de los números enteros positivos pares, A, es enumerable.
f : Z+ −→ A
definida por f (n) = 2n es una función biyectiva.

b) El conjunto de los números enteros positivos impares, A, es enumerable.
f : Z+ −→ A
definida por f (n) = 2n − 1 es una función biyectiva.

c) El conjunto de los números enteros, A, es enumerable.
f : Z+ −→ A
definida por (
n
2 si n es par
f (n) =
− n−1
2 si n es impar
es una función biyectiva.
Definición 1.11
Un conjunto es contable si y solamente si A es finito o infinito enumerable.
1.5
a) El conjunto de los números racionales Q es contable.

b) El conjunto de parejas ordenadas de números racionales Q2 es contable.
c) El conjunto de números reales [0, 1] := {x ∈ R : 0 ≤ x ≤ 1} es infinito no contable.
d) El conjunto de números reales R es infinito no contable.
Proposición 1.2
Sean A y B dos subconjuntos finitos del conjunto referencial Ω, entonces
a) |0|
/ =0
b) Si A ⊆ B, entonces |A| ≤ |B|
c) Si A y B son disyuntos, entonces |A ∪ B| = |A| + |B|
d) |A ∪ B| = |A| + |B| − |A ∩ B|
La propiedad d) se puede generalizar de la siguiente manera, su demostración es mediante inducción

matemática.
Proposición 1.3 Principio de inclusión-exclusión

Sean A1 , A2 , . . . , Am subconjuntos finitos del conjunto referencial Ω, entonces
m
|A1 ∪A2 ∪. . .∪Am | = ∑ |A j |− ∑ |Ai ∩A j |+ ∑ |Ai ∩A j ∩Ak |−. . .+(−1)m−1 |A1 ∩A2 ∩. . .∩Am |
j=1 i< j i< j<k
Definición 1.12
Una relación de equivalenciasobre un conjunto A es una relación R sobre A (es decir, R ⊆ A×A)
que satisface
a) R es reflexiva: aRa, para todo a ∈ A.
b) R es simétrica: si aRb entonces bRa, para todo a, b ∈ A.
c) R es transitiva: si aRb y bRc entonces aRc, para todo a, b, c ∈ A.
Definición 1.13
Si R es unarelación de equivalencia sobre A, entonces el conjunto
[a] := {x ∈ A : xRa}
se llama clase de equivalencia de representante a.
N El conjunto de todas las clases de equivalencia de R sobre A, se llama cociente o conjunto

cociente de R sobre A y se acostumbra simbolizar A/R.
Proposición 1.4
El conjunto cociente A/R es una partición de A, es decir satisface:
1. Para todo x ∈ A, [x] 6= 0/
2. Si [x], [y] ∈ A/R entonces [x] = [y] o bien [x] ∩ [y] = 0/
3. [˙
A= [x]
[x]∈A/R
1.2 Técnicas de Conteo

¿Cómo contar sin contar? Al enfrentar el problema de contar los elementos de un conjunto, podemos
proceder por numeración de sus elementos; sin embargo, este camino no siempre es el más pertinente
cuando queremos caracterizar ciertas propiedades de interés en sus elementos y la determinación del
número de éstos que las satisfacen. El área de las matemáticas que tiene como uno de sus objetos de
estudio el contar es la combinatoria enumerativa, cuyo origen data del siglo VI en la India.
Las técnicas que presentaremos, suficientes para un primer curso en probabilidad y sus aplicaciones,
nos permitirán responder interrogantes simples de probabilidad en los cuales se requiere determinar
el número de elementos de un conjunto, con precisión y la mayor simplicidad posible, sin tener que
elaborar extensas listas de los elementos que cumplen con las condiciones exigidas.
1.2.1 Principios fundamentales

Presentaremos algunos principios fundamentales de conteo, sin demostración, mediante los cuales
deduciremos las técnicas de combinatoria para probabilidad.
Proposición 1.5 Principio de adición

Sea A un conjunto y sean A1 , A2 , . . . , An subconjuntos de A, disyuntos dos a dos tales que
A = A1 ∪ A2 ∪ . . . ∪ An , entonces el número de elementos de A es:
|A| = |A1 | + |A2 | + . . . + |An |
La colección finita {A1 , A2 , . . . , An } se llama una partición finita de A.

Una manera alternativa, y útil para los propósitos de conteo, del Principio de Adición es la siguiente:
Proposición 1.6 Principio de adición

Si existen r1 objetos diferentes en el primer conjunto, r2 objetos diferentes en el segundo
conjunto, etcétera, y rn objetos diferentes en el n-ésimo conjunto y si cada par de estos
conjuntos es disyunto entonces el número de maneras diferentes para seleccionar un objeto de
uno de los n conjuntos es:
r1 + r2 + . . . + rn
Otro principio es el de multiplicación.
Proposición 1.7 Principio de multiplicación

Sea A un conjunto y n un entero positivo. Si cada elemento de A puede ser construido de una
y solamente una forma, eligiendo de manera independiente elementos b1 , b2 , . . . , bn de los
conjuntos B1 , B2 , . . . , Bn , respectivamente, entonces el número de elementos de A es
|A| = |B1 | · |B2 | · |B3 | . . . |Bn |
Otra manera de presentar el Principio de Multiplicación es la siguiente:
Proposición 1.8
Sea un procedimiento que se puede dividir en n etapas sucesivas (ordenadas). Y consideremos
los siguientes supuestos:
I ) Se dan r1 resultados en la primera etapa, r2 resultados en la segunda etapa, . . ., rn
resultados en la última etapa,
II ) El número de resultados en cada etapa es independiente de las selecciones en las etapas
previas,
III ) Los resultados compuestos para dar lugar al procedimiento son todos distintos,
entonces el procedimiento total tiene
r1 × r2 × . . . × rn
resultados compuestos distintos.
1.6
a) Del conjunto de los números enteros positivos de 1 a 1000, se selecciona al azar un

número cualquiera. Cuántos números serán divisibles entre 5?
b) Un grupo de asistentes a un congreso de comunicaciones está conformado por 30
individuos con pasaporte español, 20 con pasaporte inglés, 15 con pasaporte brasileño,
25 con pasaporte mexicano y 10 con pasaporte italiano. ¿De cuántas maneras se pueden
seleccionar dos individuos de este grupo, con nacionalidad diferente?
c) Supongamos que se tienen 5 libros diferentes de preparación del examen TOEFL, 6
libros diferentes del examen GRE y 4 libros diferentes del examen GMAT. Si se toman
dos libros en forma aleatoria, sin observar para que tipo de examen es, cuántas parejas
diferentes podemos formar?

d) Un comité de tres personas ha de seleccionarse de una población de 30 personas.
El primer individuo seleccionado al azar será el Presidente del comité, el segundo
seleccionado será el Secretario y el tercer seleccionado será el Tesorero del comité. De
cuántas maneras se puede obtener el comité?
a) Sea C el conjunto de números enteros de 1 a 1000 que son divisibles entre 5. Los números
divisibles entre 5 son los que terminan en 0 y los que terminan en 5. Denotemos con A el
conjunto de los números entre 1 y 1000 que terminan en 0 y con B el conjunto de los números
enteros de 1 a 1000 que terminan en 5, podemos verificar que:
|A| = 100, |B| = 100
Como C = A ∪ B y A ∩ B = 0/ por tanto
|C| = |A| + |B| = 200
b) Tenemos varios casos:

{español, inglés}, {español, brasileño}, {español, mexicano}, {español, italiano}, {inglés, brasileño},
{inglés, mexicano}, {inglés, italiano}, {brasileño, mexicano}, {brasileño, italiano} y
{mexicano, italiano}.
Por el principio de multiplicación cada caso tiene la siguiente cantidad de resultados diferentes:
30 × 20, 30 × 15, 30 × 25, 30 × 10, 20 × 15, 20 × 25, 20 × 10, 15 × 25, 15 × 10 y 25 × 10,
respectivamente.
Estas cuentas las podemos resumir en la siguiente tabla:
Pareja Número de resultados diferentes Total

{español, inglés} 30 × 20 600
{español, brasileño} 30 × 15 450
{español, mexicano} 30 × 25 750
{español, italiano} 30 × 10 300
{inglés, brasileño} 20 × 15 300
{inglés, mexicano} 20 × 25 500
{inglés, italiano} 20 × 10 200
{brasileño, mexicano} 15 × 25 375
{brasileño, italiano} 15 × 10 150
{mexicano, italiano} 25 × 10 250
entonces aplicando el principio de adición tenemos que que el número total de resultados para
escoger un par de participantes de diferentes nacionalidades es:
600 + 450 + 750 + 300 + 300 + 500 + 200 + 375 + 150 + 250 = 3875
c) Similar al problema anterior

Pareja Número de resultados diferentes Total

{TOEFL,GRE} 5×6 30
{TOEFL, GMAT} 5×4 20
{GRE, GMAT} 6×4 24
Por tanto, por el principio de adición, el número total de selecciones de dos libros diferentes
de un par de estos exámenes es: 30 + 20 + 24 = 74.
d) Sea B1 el conjunto de todos los resultados posibles para escoger quien desempeñará el cargo de
presidente, entonces |B1 | = 30, sea B2 el conjunto de todos los resultados posibles para escoger
quien desempeñará el cargo de secretario, entonces |B2 | = 29 ya que debemos descontar a
quien fue seleccionado para presidente, finalmente si B3 es el conjunto de todos los resultados
posibles de selección para tesorero entonces |B3 | = 28 y por el principio de multiplicación el
número total de diferentes comités que se pueden constituir es 30 × 29 × 28 = 24360
1.2.2 Muestras
En las técnicas de conteo se emplea un vocabulario propio de la estadística, población refiriéndose al
conjunto objetivo de estudio (que corresponde al conjunto referencial), y muestra que corresponde a
un subconjunto de la población cuyos elementos tienen la característica de nuestro interés para medir
o contar. Cuando se toma una muestra de la población se dice que se está muestreando la población.
Modelo de la urna: imaginemos una urna, caja cerrada que no permite ver hacia su interior
pero que tiene en la parte superior la manera de sacar los elementos depositados en ella, que
contiene n pelotas marcadas con los números del 1 al n, del mismo tamaño, forma, material,
etc., solo distinguibles por el número colocado en ellas.
Existen cuatro maneras, que se expondrán a continuación, en que las pelotas pueden sacarse
de la urna.
Muestreo con reemplazo y con orden

Un total de m pelotas es sacado de la urna, de manera secuencial (una a una), después de que una
pelota es sacada, se anota su número y se devuelve a la urna, mezclando bien con las demás. El orden
en que las pelotas, sus números, se sacan es anotado. Estos significa que la secuencia 1, 4, 3, 4 es
diferente de la secuencia 4, 3, 1, 4; utilizaremos una representación vectorial para enfatizar el orden
escribiendo estas secuencias como (1, 4, 3, 4) y (4, 3, 1, 4).
Pregunta: ¿Cuántas muestras ordenadas, con reemplazo, de tamaño m se obtienen?
m
n| × n ×
{z. . . × n} = n
m veces
Observemos que en este caso, es posible tener m ≥ n.

1.7
Un quiz consta de cinco preguntas de verdadero o falso, por tanto existen dos manera de
responder la primera pregunta, dos maneras para responder la segunda preguntas, etc., dos
maneras para responder la quinta pregunta; por tanto el número total de formas en que el quiz
puede contestarse es:
2 × 2 × 2 × 2 × 2 = 25 = 32
1.8
Un jugador de baloncesto practica su tiro libre. Cada lanzamiento da lugar a dos resultados
posibles: encesta, 1, no encesta, 0. Si el jugador hace 10 lanzamientos, de ¿cuántas maneras
puede darse el resultado total de lanzamientos?
210
Muestreo sin reemplazo y con orden

Un total de m pelotas es sacada de la urna, m ≤ n. Después de que una pelota es sacada de la urna, se
anota su número y no se devuelve a la urna, por tanto en la urna quedarán n − 1 pelotas, la segunda
pelota es seleccionada de las n − 1 restantes en la urna, se anota su número y no se devuelve a
la urna, quedando n − 2 pelotas para seleccionarse en la tercera extracción, se continúa con este
procedimiento hasta sacar la m-ésima pelota de la urna.
El número total de muestras posibles con orden y sin reemplazo es:
n!
n × (n − 1) × (n − 2) × . . . × (n − m − 1) = ≡ n pm
(n − m)!
1.9
Un profesor tiene 10 proyectos diferentes para asignar a 6 grupos, cada grupo deberá desarro-
llar un proyecto diferente al proyecto de los otros grupos. ¿De cuántas maneras posibles se
pueden asignar los proyectos a estos grupos?
10!
10 × 9 × 8 × 7 × 6 × 5 = = 151200
4!
Definición 1.14
Un arreglo de objetos, también llamado una sucesión ordenada de objetos, se llama una
permutación de los objetos.
Una sucesión ordenada de n objetos se llama una n-permutación; con n objetos diferentes, existen
n! permutaciones posibles, que corresponde al número de maneras diferentes en que los n objetos
distintos se pueden ordenar.
1.10
La pieza básica de los ácidos nucleicos son los nucleotidos. El ADN (ácido desoxirribonu-
cleico) es formado por largas cadenas de nucleótidos. Las bases utilizadas en el ADN son la
adenina (A), citosina (C), guanina (G) y timina (T).
a) El número de cadenas de ADN de longitud 4 es:
4 × 4 × 4 × 4 = 44 = 256
b) El número de cadenas de ADN de longitud 4, sin repetición de nucleótidos, es:
4 × 3 × 2 × 1 = 4! = 24
Proposición 1.9
Si se tienen n objetos distintos, entonces el número de permutaciones de tamaño m que se
pueden formar es:
n!
n pm :=
(n − m)!
Observemos que si m = n entonces (n − m)! = 0! = 1 y por tanto n pn = n!.

Las muestras ordenadas sin repetición reciben el nombre de permutaciones n objetos tomados en
una muestra de tamaño m.
Muestreo sin reemplazo y sin orden

De un total de n pelotas, en una urna, se extraen m pelotas. Las pelotas seleccionadas no se regresan
a la urna y el número marcada en ellas se anota pero no se anota la posición de orden en que se sacó,
también podemos pensar que las m pelotas se sacan simultáneamente.
El número total de muestras no ordenadas y sin reemplazo es:

n n!
:=
m m!(n − m)!
1.11
Consideremos el conjunto A = {a, e, i, o, u}. Cuántos subconjuntos de A con dos elementos

(observe que por ser conjunto no importa el orden de sus elementos) se pueden formar?
Escribamos en forma extensiva todos los subconjuntos de A que tengan dos elementos:
{a, e}, {a, i}, {a, o}, {a, u}, {e, i}, {e, o}, {e, u}, {i, o}, {i, u}, {o, u},
Observemos que de cada subconjunto podemos sacar 2 permutaciones, por ejemplo del conjunto
{a, e} podemos formar las permutaciones de tamaño 2: ae, ea, por tanto el número de muestras de
tamaño 2 donde no importa el orden multiplicado por el factorial del tamaño de cada muestra nos da
el número total de permutaciones de tamaño 2 tomadas de un conjunto de cardinal 5.
En general si nCk denota el número total de muestras de tamaño k, sin que el orden de los elementos
de estas muestras importe, tomadas de un conjunto de tamaño n entonces:

n pk n! n
k!nCk =n pk =⇒n Ck = = =
k! k!(n − k)! k
Proposición 1.10 Combinaciones

De una una población de tamaño n, el número de muestras no ordenadas de tamaño k es:

n n!
= ; 0≤k≤n
k k!(n − k)!
1.12
Una pizzeria ofrece su producto con 10 opciones, cada una de las cuales trae 2, 3, o 4
ingredientes; y los tamaños que maneja son personal, mediana, grande y extragrande.
X El número total de opciones con tres ingredientes, sin tener en cuenta el tamaño, es:

10 10!
= = 120
3 3!7!
X El número total de opciones con cualquiera de los ingredientes, y cualquier tamaño es

(aplicando el principio de multiplicación)

4 10 10 10
× + + = 4 × 375 = 1500
1 2 3 4
Muestras con reemplazo y sin orden

De una urna con n pelotas, se extraen m pelotas, una a una y luego se retornan a la urna; en cada
extracción se anota el número de que la pelota trae marcado pero se ignora la posición de extracción
de ésta.
Proposición 1.11
El número total de m pelotas que pueden ser extraídas, sin orden y con devolución, de un urna
con n pelotas, es:

n+m−1
m
Observemos que sacar la muestra 3, 1, 3, 2 es la misma que extraer 3, 2, 1, 3. Solamente necesitamos

saber cuántas veces cada pelota sale, es decir para describir 3, 1, 3, 2 o 3, 2, 1, 3 solo es necesario
saber que la pelota numerada con 1 sale una vez, la pelota marcada con 2 sale una vez y la pelota
marcada con 3 aparece dos veces; esta muestra se puede representar de la siguiente manera:
1 2 3
1 2 3 3 X X XX
Las muestras 1, 1, 1, 3 y 1, 3, 1, 1, y las otras de tamaño cuatro que contengan estos números, las
interpretamos como sigue:
1 2 3
1 1 1 3 XXX X
Ahora bien, cualquiera de estas muestras se puede representar especificando el arreglo de las marcas
X en el interior de un par de lineas verticales:
1 2 3 Nueva representación
1 2 3 3 X X XX X|X|XX
1 1 1 3 XXX X XXX||X
así por ejemplo,
||XX|||XXXX
representa la muestra 3, 3, 6, 6, 6, 6.
En general, si existen n pelotas en la urna y se toma una muestra con repetición y no ordenada de
tamaño m entonces en la nueva representación tendremos m marcas X y n − 1 lineas |, por tanto el
número de maneras distintas para seleccionar m posiciones de (n − 1) + m posiciones es

n+m−1
m
1.13
Ocho personas se suben a un elevador inteligente de una torre hospitalaria de diez pisos. El
elevador, al ascender solo se detiene en los números impares, después del primer piso. El
elevador cuenta con un sensor que registra el número de personas que se baja en cada piso,
¿cuántas posibilidades diferentes existen?
En este caso n = 4, pisos impares del 3 al 10, que hacen el papel de las pelotas en la urna; y m = 8,
el número de usuarios que subió al elevador, que corresponden a las pelotas de la muestra. Entonces
el número de maneras en que pueden ocurrir las bajadas del elevador es:

4+8−1 11
= = 165
8 8
En la siguiente sección abordaremos uno caso especial donde algunos de los elementos que constitu-
yen la población son indistinguibles.
Permutaciones con elementos indistinguibles

Consideremos el caso de la urna con n bolas, con n1 de ellas numeradas con el número 1 (indistin-
guibles), n2 numeradas con el número 2, etcétera, y nk de ellas numeradas con el número k, y tales
que
n1 + n2 + n3 + . . . + nk = n
Si las bolas son dispuestas en una fila, el número de arreglos (muestras ordenadas) distinguibles es:
n!
n1 !n2 ! . . . nk !
esta fracción se denota

n
n1 , n2 , . . . , nk
y se llama coeficiente multinomial.
1.14
a) Dadas las tres letras diferentes A, B,C existen 3! = 6 permutaciones:
ABC, ACB, BAC, BCA,CAB,CBA
esto es consecuencia de que todas las letras son diferentes.

b) Consideremos la palabra ORO. Existen solamente 3 arreglos ordenados:
ORO, ROO, OOR
Puesto que la letra O aparece dos veces, el número 3! deberá ser dividido por 2! para
3!
obtener el número de arreglos ordenados distintos: =3
2!
c) Consideremos la palabra MATEMATICA, que contiene la letra M dos veces, T dos
veces y la letra A tres veces. Entonces el número de arreglos ordenados distintos que se
pueden formar con las letras de esta palabra es:
10!
= 151200
2!2!3!
1.15
De un curso con 20 estudiantes se van a conformar equipos de trabajo de la siguiente manera:

un equipo con 2 estudiantes, un equipo con 3 estudiantes, un equipo con 4 estudiantes, un
equipo con 5 estudiantes y un equipo con 6 estudiantes. ¿De cuántas maneras se pueden
conformar los equipos?
Luego de constituido cada equipo, sus miembros son elementos indistinguibles del equipo lo que los
distingue del resto es que son de ese equipo. Razonemos de la siguiente manera y luego utilicemos
el principio de multiplicación para hallar el número total de equipos que se pueden organizar:
X Primer equipo. El número de maneras en que se puede constituir es:

20
2
X Segundo equipo. El número de maneras en que se puede constituir es:

18
3
X Tercer equipo. El número de maneras en que se puede constituir es:

15
4
X Cuarto equipo. El número de maneras en que se puede constituir es:

11
5
X Quinto equipo. El número de maneras en que se puede constituir es:

6
6
Por el principio de multiplicación, el número total de equipos diferentes que se puede conformar es:

20 18 15 11 6 20! 18! 15! 11! 6! 20!
= =
2 3 4 5 62 2!18! 3!15! 4!11! 5!6! 0!6! 2!3!4!5!6!
es decir,

20
2, 3, 4, 5, 6
Espacios medibles
σ − Algebra
Espacio de Probabilidad
Probabilidad condicional e independen-
cia
Probabilidades totales y regla de Bayes
Independencia
2 — Espacio de probabilidad
2.1 Espacios medibles

La aleatoriedad y la incertidumbre existen en el mundo que nos circunda. En las diferentes áreas
del pensamiento humano encontramos situaciones donde al experimentar u observar un fenómeno,
nos encontramos que podemos describir sus posibles resultados y sin embargo no es posible esta-
blecer previamente cuál de todos los resultados se materializará. En este capitulo estableceremos la
estructura matemática de la noción de probabilidad a partir de los axiomas de Kolmogorov.
Es necesario generalizar las operaciones intersección y unión de conjuntos a más de dos conjuntos.
Para los propósitos de este curso bastará extenderlas a una colección contable de conjuntos.
Definición 2.1
Una sucesión de conjuntos en el espacio referencial Ω es una colección enumerada de
subconjuntos de Ω, (A j )∞j=1 , donde para cada j, j = 1, 2, . . ., A j ⊆ Ω.
Definición 2.2
Dada una sucesión (A j )∞j=1 se define la unión e intersección de esta sucesión de la siguiente
manera
• Unión:
∞
[
Ai = {x ∈ Ω : x ∈ Ai , para algún i}
i=1
• Intersección:
∞
\
Ai = {x ∈ Ω : x ∈ Ai , para todo i}
i=1
24 Espacio de probabilidad
Proposición 2.1 Propiedades distributivas

Sean A, B, C subconjuntos de Ω y (Di )∞
i=1 una sucesión de subconjuntos de Ω.
I ) A ∩ (B ∪C) = (A ∩ B) ∪ (A ∩C)
II ) A ∪ (B ∩C) = (A ∪ B) ∩ (A ∪C)
S∞ S∞
III ) A ∩ ( i=1 Di ) = i=1 (A ∩ Di )
T∞ T∞
IV ) A ∪ ( i=1 Di ) = i=1 (A ∪ Di )
Proposición 2.2 Leyes de De Morgan

Sean A, B, C subconjuntos de Ω y (Di )∞
i=1 una sucesión de subconjuntos de Ω.
c c
I ) (A ∪ B) = A ∩ B c
II ) (A ∩ B)c = Ac ∪ Bc
c
III )
S∞
=
T∞ c
i=1 Di i=1 Di
c
IV )
T∞
=
S∞ c
i=1 Di i=1 Di
Proposición 2.3
Sean A y B subconjuntos de un espacio referencial Ω, entonces
I ) Si A ⊆ B entonces A ∩ B = A y A ∪ B = B
II ) A = (A ∩ B) ∪ (A ∩ Bc )
2.1.1 σ − Algebra
Definición 2.3 σ -algebra
Una colección F de subconjuntos de Ω, F ⊂ 2Ω , que satisface los siguientes tres axiomas:
a) Ω ∈ F
b) Si A ∈ F entonces Ac ∈ F
c) Si (A j )∞j=1 es una sucesión en F entonces ∞j=1 A j ∈ F
S
se llama una σ − algebra sobre Ω
N El par (Ω, F) se llama espacio medible y los elementos de F se llaman conjuntos medibles o
eventos.
En la siguiente proposición se dan algunas propiedades de una σ − algebra.
Proposición 2.4
Sea F una σ − algebra sobre Ω.
a) 0/ ∈ F
b) Si A, B ∈ F entonces A ∪ B ∈ F
c) Si (A j )∞j=1 ⊂ F entonces ∞j=1 A j ∈ F
T
2.1 Espacios medibles 25
d) Si A, B ∈ F, entonces A ∩ B ∈ F
e) Si A, B ∈ F, entonces B − A ∈ F
a) Como Ω ∈ F entonces 0/ = Ωc ∈ F.
b) Consideremos la sucesión (A j )∞j=1 ⊂ F, definida por A1 = A, A2 = B, 0/ = A3 = A4 . . ., entonces
S∞
j=1 A j = A1 ∪ A2 ∪ 0 / ∪ 0/ ∪ . . . = A ∪ B ∈ F
c) Como (A j ) j=1 ⊂ F entonces A j ∈ F, para cada j, j = 1, 2, . . ., luego A j c ∈ F, para cada
∞
j, j = 1, 2, . . ., por tanto ∞j=1 A j c ∈ F, entonces por las leyes de Morgan ( ∞j=1 A j )c ∈ F,

S T
entonces por el Axioma b), de la definición de σ − algebra, j=1 A j ∈ F, ya que (Ac )c = A.

T∞
d) Basta aplicar el ítem anterior con A1 = A, A2 = B, A j = 0, / para todo j ≥ 3.

e) Como B − A = B ∩ Ac , entonces B − A ∈ F porque B, Ac ∈ F.
2.1
a) 2Ω es una σ − algebra, la σ − algebra maximal en Ω.

b) {∅, Ω} es una σ − algebra, la σ − algebra minimal en Ω.
De esta manera si G es una σ − algebra sobre Ω entonces {∅, Ω} ⊂ G ⊂ 2Ω
c) Sea B ⊂ Ω. {∅, B, Bc , Ω} es una σ − algebra.
d) Si B ⊂ Ω, B 6= ∅, B 6= Ω, entonces {∅, B, Ω} No es una σ − algebra.
Proposición 2.5 σ − algebra traza

Sea F una σ − algebra sobre Ω y A ⊂ Ω. La colección FA = A ∩ F := {A ∩ B : B ∈ F} es una
σ − algebra sobre A.
a) Como Ω ∈ F y A = A ∩ Ω, entonces A ∈ FA
b) Sea W ∈ FA entonces existe B ∈ F tal que W = A ∩ B. Se probará que W c ∈ FA , W c := A −W ,
el complemento de W relativo a A
• Como B ∈ F entonces Bc = Ω − B ∈ F, por tanto A ∩ (Ω − B) = A ∩ Bc ∈ FA .
• A ∩W c = A −W = A − (A ∩ B) = A ∩ (A ∩ B)c = A ∩ (Ac ∪ Bc ) = (A ∩ Ac ) ∪ (A ∩ Bc ) =
∅ ∪ (A ∩ Bc ) = A ∩ Bc .
Así W c = A −W ∈ FA
c) Si (A j )∞j=1 es una sucesión en FA entonces para cada j, j = 1, 2, . . . existe un B j ∈ F tal
que A j = A ∩ B j , por tanto ∞j=1 A j = ∞j=1 (A ∩ B j ) = A ∩ ( ∞j=1 B j ); y como ∞j=1 B j ∈ F,
S S S S
entonces A ∩ ( ∞j=1 B j ) ∈ FA
S
Proposición 2.6 σ − algebra imágen inversa

0 0
Sea f : Ω −→ Ω , y G una σ − algebra sobre Ω . Entonces la colección
F = f −1 (G) := { f −1 (G) : G ∈ G}
es una σ − algebra sobre Ω.

0 0
a) Ω ∈ G entonces Ω = f −1 (Ω ) ∈ F
b) Sea B ∈ F entonces existe G ∈ G tal que B = f −1 (G), luego Bc = ( f −1 (G))c = f −1 (Gc ), y
como Gc ∈ G entonces f −1 (Gc ) = Bc ∈ F.
c) Si (B j )∞j=1 es una sucesión en F entonces para cada j, j = 1, 2, . . . existe un G j ∈ G tal que
B j = f −1 (G j ), por tanto ∞j=1 B j = ∞j=1 f −1 (G j ) = f −1 ( ∞j=1 G j ); y como ∞j=1 G j ∈ G,
S S S S
entonces f −1 ( ∞j=1 G j ) ∈ F, es decir ∞j=1 B j ∈ F

S S
Teorema 2.1
a) Sea J ⊂ R, J 6= ∅. Si F j es una σ − algebra sobre Ω, para cada j ∈ J entonces la
colección \
F := Fj
j∈J
es una σ − algebra sobre Ω.

b) Si C es una colección de subconjuntos de Ω, es decir C ⊂ 2Ω , entonces existe una
σ − algebra minimal F que contiene a C.
a) Es necesario probar los tres axiomas de σ − algebra para la colección F.

T∞
I ) Como Ω ∈ F j , para cada j, j ∈ J, entonces Ω ∈ j=1 F j , es decir Ω ∈ F.
T∞
II ) Si B ∈ F = j=1 F j , entonces B ∈ F j , para cada j, j ∈ J, y como cada F j es una
σ − algebra sobre Ω entonces Bc ∈ F j , para cada j, j ∈ J, por tanto Bc ∈ ∞j=1 F j , es
T
decir Bc ∈ F.
T
III ) Sea (A j )∞
j=1 una sucesión en F = j∈J F j , entonces
\
(A j )∞j=1 ⊂ Fj
j∈J
(A j )∞j=1 ⊂ F, ∀ j ∈ J por definición de intersección

[
A j ∈ F j, ∀ j ∈ J porque cada F j es σ − algebra
j∈J
[ \
Aj ∈ F j = F, ∀ j ∈ J por definición de intersección
j∈J j∈J
b) Sea F := ∞j=1 {F j : F j es una σ − algebra y F j ⊃ C}.

T
X De la parte a) de este teorema, F es una σ − algebra.

X F ⊃ C, por definición de F.
X Veamos que F es minimal, es decir si G es una σ − algebra que contiene a C entonces
G ⊃ F.
La última afirmación es directa ya que G es un σ − algebra que contiene a C, por tanto
G ∈ {F j : F j es sigma − algebra y F j ⊃ C}, luego G ⊃ F := j∈J F j .
T
Definición 2.4
La σ − algebra F, construida en el teorema anterior, se denomina σ − algebra generada por
la colección C, y se simboliza σ (C).
2.2
a) Si A es una σ − algebra sobre Ω entonces σ (A) = A

b) Si A ⊂ Ω entonces σ ({A}) = {∅, A, Ac , Ω}
c) Si A1 y A2 son dos colecciones de subconjuntos de Ω tales que A1 ⊂ A2 , entonces
σ (A1 ) ⊂ σ (A2 )
Definición 2.5
Sea O n la colección de conjuntos abiertos en Rn entonces la σ − algebra generada por O n ,
σ (O n ) se llama la σ − algebra de Borel sobre Rn , se denota por B(Rn ) o simplemente
por Bn si se sobreentiende que se está trabajando en Rn . Los elementos de Bn se llaman
conjuntos de Borel.
Definición 2.6
Sea (Ω, F) un espacio medible. Una función µ : F −→ [0, ∞) tal que
I ) No negativa: µ(A) ≥ 0, para todo A ∈ F
II ) Contablemente aditiva: µ(∪ j A j ) = ∑ j µ(A j ), para cualquier sucesión, contable, de
conjuntos disyuntos A j ∈ F
se llama una medida sobre (Ω, F). La tripla (Ω, F, µ) se llama espacio de medida.
2.2 Espacio de Probabilidad
Definición 2.7
Un experimento es aleatorio si sus resultados no se pueden predecir con certeza, además si el
experimento se repite bajo las mismas condiciones entonces los resultados posibles ocurren
con cierta regularidad estadística.
2.3
A continuación enumeramos algunos experimentos aleatorios.

a) Una moneda, no necesariamente “legal”, se lanza dos veces. Un resultado típico de este
experimento es (S,C), donde S denota “sello” y C indica “cara”. El conjunto de todos
los resultados posibles es {(C,C), (C, S), (S,C), (S, S)}
b) Se lanza una moneda hasta que se obtenga “cara” por primera vez, el experimento ob-
serva (graba) el número de lanzamientos requeridos para lograrlo. Entonces el conjunto
de todos los resultados posibles es {1, 2, 3, . . .}
c) El tiempo de espera de un paciente en una consulta médica. El conjunto de todos los
resultados posibles es un intervalo de la forma [0, L], para alguna constante L ≥ 0.
d) Cuando nos encontramos en una estación de transporte público el número de pasajeros
que llevará el autobus que tomaremos.
e) El volumen de lluvia que caerá en una región dada un día determinado.

f ) El precio del barril de petróleo WTI al inicio del próximo mes.
g) El número de partículas que atravesará una cámara de un contador Geiger, en un
intervalo de tiempo.
Definición 2.8
El conjunto de todos los resultados posibles de un experimento aleatorio se llama espacio
muestral. Es usual denotarlo con la letra Ω.
Definición 2.9
Una medida µ sobre un espacio medible (Ω, F) tal que µ(Ω) = 1 se llama una medida de
probabilidad (denotaremos la medida de probabilidad µ por P.). La tripla (Ω, F, P) se llama
espacio de probabilidad.
2.4
Consideremos el conjunto Ω, donde Ω = {1, 2, 3, 4, 5, 6, . . . , N} y la σ -algebra F = 2Ω . La

función de conjunto P(A) := |A|
N , definida sobre 2 , donde |A| indica el número de elementos
Ω
de A, es una medida de probabilidad.
a) Para todo A ∈ 2Ω , es decir para todo A subconjunto de Ω, P(A) = |A| ≥ 0.

b) Sea (A j )nj=1 una sucesión de subconjuntos de Ω disyuntos dos a dos, entonces por el principio
de inclusión-exclusión
n
| ∪nj=1 A j | = ∑ |A j | − ∑ |Ai ∩ A j | + . . . (−1)n−1 |A1 ∩ A2 ∩ . . . ∩ An |
i=1 i< j
como la sucesión es disyunta dos a dos, entonces

n
| ∪nj=1 A j | = ∑ |A j |
i=1
luego
| ∪nj=1 A j | 1 n 1 n n
|A j | n
P(∪nj=1 A j ) = = | ∪ A j| = ∑ |A j | = ∑ = ∑ P(A j )
N N j=1 N j=1 j=1 N j=1
|Ω| N
c) µ(Ω) = N = N = 1.
Teorema 2.2
Sea (Ω, F, P) un espacio de probabilidad, A, B, A j , eventos en F. Entonces
I ) Monotonía: Si A ⊆ B entonces P(A) ≤ P(B)
II ) Continuidad desde abajo: Si la sucesión de eventos (A j ) j es tal que A1 ⊆ A2 ⊆ . . ., y
∪ j A j = A, entonces P(A j ) ↑ P(A).

III ) Continuidad desde arriba: Si la sucesión de eventos (A j ) j es tal que A1 ⊇ A2 ⊇ . . ., y
∩ j A j = A, entonces P(A j ) ↓ P(A).
IV ) Sub-aditividad: Si A ⊆ ∪ j A j entonces P(A) ≤ ∑ j P(A j )
El símbolo ↑ significa hacia arriba y ↓ hacia abajo. Veamos la demostración.

I ) Como A ⊆ B entonces B = A ∪ (B − A), y A ∩ (B − A) = 0,
/ por tanto
P(B) = P(A) + P(B − A) ⇒ P(A) ≤ P(B)
Además en este caso, es decir para A ⊆ B, podemos concluir que P(B − A) = P(B) − P(A)
II ) Definimos una nueva sucesión de eventos, disyuntos dos a dos, de la siguiente manera:
B1 = A1 , B2 = A2 − A1 , B3 = A3 − A2 , . . . , Bn = An − An−1 , . . .
La sucesión (B j )∞j=1 es disyunta dos a dos y satisface
A1 = B1 , A2 = B1 ∪ B2 , . . . , An = ∪nj=1 B j , . . .
∞
[ ∞
[
Bj = Aj = A
j=1 j=1
Ahora bien
∞
[

P(A) = P Bj
j=1
∞
= ∑ P(B j ) por σ − aditividad
j=1
n
= lı́m ∑ P(B j ) por convergencia serie
n→∞
j=1
n
[

= lı́m P Bj por σ − aditividad
n→∞
j=1
= lı́m P(An ) por construcción

n→∞
III )Una construcción similar a la del numeral anterior permite demostrar esta afirmación.
IV ) Prueba por inducción matemática para la desigualdad:
P(A1 ∪ A2 ∪ . . . ∪ An ) ≤ P(A1 ) + P(A2 ) + . . . + P(An )
X n = 1: P(A1 ) ≤ P(A1 )
X n = 2: P(A1 ∪ A2 ) = P(A1 ) + P(A1 ) − P(A1 ∩ A2 ) ≤ P(A1 ) + P(A1 )
X n = 3:
3
[
3
P Aj = ∑ P(A j ) − ∑ P(Ai ∩ A j ) + P(A1 ∩ A2 ∩ A3 )
j=1 j=1 1≤i< j≤3
3
= ∑ P(A j ) − ∑ P(Ai ∩ A j ) − P(A1 ∩ A2 ∩ A3 )
j=1 1≤i< j≤3
3
≤ ∑ P(A j ) porque A1 ∩ A2 ∩ A3 ⊆ A1 ∩ A2
j=1
X Hipótesis inductiva la desigualdad es valida para n = k:

k k
[
P Aj ≤ ∑ P(A j )
j=1 j=1

Sk
Prueba para n = k + 1, sea B = j=1 A j , entonces
k+1 k
[ [
P Aj =P A j ∪ Ak+1
j=1 j=1
= P(B ∪ Ak+1 )
≤ P(B) + P(Ak+1 ) por n = 2
k
≤ ∑ P(A j ) + P(Ak+1 ) por hipótesis inductiva
j=1
k+1
= ∑ P(A j )
j=1
Finalmente, para el caso infinito consideramos la sucesión (B j )∞j=1 definida por

A1 n=1
Bn =

 n−1
j=1 A j ∪ An
S
n = 2, 3, . . .
satisface
n
[ n
[ ∞
[ ∞
[
B1 ⊆ B2 ⊆ . . . ⊆ Bn . . . ; Bj = A j, Bj = Aj
j=1 j=1 j=1 j=1
entonces por la continuidad de la medida de probabilidad, P, tenemos.

∞
[
n
[ n
[ n ∞
P Aj = lı́m ↑ P( B j ) = lı́m ↑ P( A j ) ≤ lı́m ∑ P(A j ) = ∑ P(A j )
n→∞ n→∞ n→∞
j=1 j=1 j=1 j=1 j=1
Proposición 2.7
Sea (Ω, F, P) un espacio de probabilidad, entonces
1) P(0)/ =0
2) Si A, B ∈ F, tales que A ∩ B = 0,
/ entonces P(A ∪ B) = P(A) + P(B)
3) Sean A, B ∈ Ω tales que A ⊂ B entonces P(A) ≤ P(B) y P(B − A) = P(B) − P(A)
4) Si A, B ∈ F, entonces P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
5) P(Ac ) = 1 − P(A)
1) Como Ω ∩ 0/ = 0/ y Ω = Ω ∪ 0,
/ entonces aplicando el axioma P3 obtenemos
P(Ω) = P(Ω) + P(0)

/
/ =0
por tanto P(0)
2) Consideremos la sucesión de eventos (A j )∞j=1 definida por
/ ∀n ≥ 3
A1 = A, A2 = B, An = 0,
entonces aplicando el axioma P3 obtenemos P(A ∪ B) = P(A) + P(B), ya que P(0) / =0

3) Como A ⊂ B entonces B = A ∪ (B − A), con los eventos A y B − A disyuntos, entonces
P(B) = P(A) + P(B − A), despejando P(B − A) obtenemos P(B − A) = P(B) − P(A); además
de la igual P(B) = P(A) + P(B − A) y de la no-negatividad de la medida de probabilidad P,
tenemos la desigualdad P(A) ≤ P(B)
4) De la igualdad A ∪ B = A ∪ (B − (A ∩ B)), y teniendo en cuenta que los eventos A y B − (A ∩ B)
son disyuntos, entonces aplicando el axioma P3 se tiene que P(A∪B) = P(A)+P(B−(A∩B));
ahora bien de la relación de contenencia A ∩ B ⊂ B por el numeral 3) de esta proposición
tenemos que P(B − (A ∩ B)) = P(B) − P(A ∩ B), por tanto:
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
5) Como Ω = A ∪ Ac , y A ∩ Ac = 0,
/ entonces
P(Ω) = P(A) + P(Ac ) ⇒ 1 = P(A) + P(Ac ) ⇒ P(Ac ) = 1 − P(A)
2.5
Un grupo consta de n personas. ¿Cuál es la probabilidad que por lo menos dos personas
cumplan años en el mismo día? Asumamos que el año no es bisiesto y que cada día del año es
igualmente probable para un nacimiento.
Idealizamos la situación suponiendo que los días del año se han marcada en balotas que han sido
colocadas en una urna, el nacimiento de cada individuo corresponde a la extracción al azar de una
balota de la urna. Y denotamos con A el evento de interés
A := “por lo menos dos personas cumplan años en el mismo día”

Vamos a resolver el problema a través del evento complementario:
Ac := “Menos de dos personas cumplen años en el mismo día”
es decir Ac corresponde a cada persona cumple años en diferente día.

X Casos totales: pueden darse repeticiones en el día del cumpleaños.
× . . . × 365} = 365n
| × 365{z
365
n veces
X Casos favorables: Cada persona cumple años un día distinto de todos y cada uno de los
demás:
365 364 363 ... 365 − (n − 2) 365 − (n − 1)
↑ ↑ ↑ ... ↑ ↑
1o 2o 3o ... (n − 1) − ésimo n − ésimo
es decir
365!
(365) × (364) × . . . (365 − (n − 1)) =
(365 − n)!
Por tanto la probabilidad de que ningún par de personas, de un grupo de n individuos, cumpla años
en el mismo día es:
365!
(365−n)!
365n
En consecuencia, la probabilidad de que dos o más personas,de las n en el grupo, cumpla años el
mismo día es:
365!
(365−n)!
1−
365n
En la siguiente tabla se ilustran algunos valores de la probabilidad de que dos o más personas
cumplan años en un mismo día, para diferentes valores de n el tamaño del grupo de individuos.
Proposición 2.8
Principio de inclusión - exclusión
Para cualquier conjunto de eventos {A1 , A2 , . . . , An } en un espacio de probabilidad (Ω, F, P)
se verifica la fórmula:
n
[ n
P( A j ) = ∑ P(Ai )− ∑ P(Ai ∩A j )+ ∑ P(Ai ∩A j ∩Ak )+. . .+(−1)n+1 P(A1 ∩A2 . . .∩An )
j=1 i=1 i< j i< j<k
En efecto
I ) n = 2: P(A1 ∪ A2 ) = P(A1 ) + P(A2 ) − P(A1 ∩ A2 )
II ) n = 3: P(A1 ∪ A2 ∪ A3 ) = P[(A1 ∪ A2 ) ∪ A3 ]
= P(A1 ∪ A2 ) + P(A3 ) − P[(A1 ∪ A2 ) ∩ A3 ]
= P(A1 ) + P(A2 ) − P(A1 ∩ A2 ) + P(A3 ) − P[(A1 ∩ A3 ) ∪ (A2 ∩ A3 )]
= P(A1 ) + P(A2 ) + P(A3 ) − P(A1 ∩ A2 ) − P(A1 ∩ A3 ) − P(A2 ∩ A3 ) + P(A1 ∩ A2 ∩ A3 )
III ) Hipótesis de inducción, n:
n
[ n
P( A j ) = ∑ P(Ai ) − ∑ P(Ai ∩ A j ) + ∑ P(Ai ∩ A j ∩ Ak ) + . . . + (−1)n+1 P(A1 ∩ A2 . . . ∩ An )
j=1 i=1 i< j i< j<k
Sn
IV ) Tesis de inducción: n+1: Sea B := j=1 A j , entonces
n+1
[
P Aj = P(B ∪ An+1 )
j=1
= P(B) + P(An+1 ) − P(B ∩ An+1 )

n
[
= P(B) + P(An+1 ) − P (A j ∩ An+1 )
j=1

Sn
Aplicamos la hipótesis de inducción a P(B) y P j=1 (A j ∩ An+1 ) :
En la segunda expansión el primer término involucra a A j , j = 1, 2, . . . , n con An+1 es decir

incluye intersecciones con dos eventos, uno de los cuales es An+1 , signados negativamente,
el segundo términos involucra dos eventos distintos A j intersectados con An+1 es decir tres
eventos intersectados con An+1 fijo, probabilidad signada positiva; etcétera, el último término
es P(A1 ∩ A2 ∩ . . . ∩ An+1 ) signado (−1)n+1 . Reorganizando términos tenemos la fórmula para
n + 1.
2.6
El 80 % de los estudiantes de ingeniería, de primer semestre, toma cálculo, el 50 % física, y el

40 % toma ambas asignaturas, cálculo y física.
a) ¿Cuál es la probabilidad de que un estudiante de primer semestre tome al menos una de
estas asignaturas?
b) ¿Cuál es la probabilidad de que un estudiante de primer semestre tome solamente una
de estas asignaturas?
Denotemos con A el evento “cálculo” y con B el evento “física”, entonces P(A) = 0.8, P(B) = 0.5 y
P(A ∩ B) = 0.4.
a) El evento A ∪ B representa el suceso que un estudiante de primer semestre de ingeniería tome
al menos una de estas asignaturas, luego
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = 0.8 + 0.5 − 0.4 = 0.9
b) La representación del suceso: un estudiante de primer semestre de ingeniería toma exactamente
una de las dos asignaturas, cálculo o física, está dada por el evento (A ∩ Bc ) ∪ (B ∩ Ac ), por
tanto debemos hallar
P(A ∩ Bc ) + P(B ∩ Ac )
X Como A = (A ∩ B) ∪ (A ∩ Bc ), entonces
P(A) = P(A ∩ B) + P(A ∩ Bc ) ⇒ P(A ∩ Bc ) = 0.8 − 0.4 = 0.4
X Como B = (B ∩ A) ∪ (B ∩ Ac ), entonces
P(B) = P(B ∩ A) + P(B ∩ Ac ) ⇒ P(B ∩ Ac ) = 0.5 − 0.4 = 0.1
por tanto
P(A ∩ Bc ) + P(B ∩ Ac ) = 0.4 + 0.1 = 0.5
Una forma alterna es calcular
P(A ∪ B) − P(A ∩ B) = 0.9 − 0.4 = 0.5
N Un naipe, o mazo de cartas, está constituido por 4 pintas, dos de color rojo y dos de color
negro:
X Picas: ♠.
X Tréboles: ♣.
X Corazones: ♥.
X Diamantes: ♦.
Cada pinta, suit, está formada por 13 cartas rotuladas: A, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K, las
figuras A,J, Q, K corresponden a un As, un Jocker, queen y king, respectivamente.
2.7
¿Cuál es la probabilidad de sacar 6 cartas de un mazo de 52 cartas, de modo que se obtenga,

por lo menos, una carta de cada pinta?
a) Casos totales
Si no imponemos la condición “obtener una carta, por lo menos, de cada pinta”, entonces el
número de muestras no ordenadas y sin repetición (6 cartas de un mazo de 52 cartas) es:

52
6
b) Consideremos los eventos siguientes:
X E: muestras donde no salen cartas del palo de picas.
X T : muestras donde no salen cartas del palo de tréboles.
X C: muestras donde no salen cartas del palo de corazones.
X D: muestras donde no salen cartas del palo de diamantes.
Entonces debemos calcular

52
− |E ∪ T ∪C ∪ D|
6
El principio de inclusión-exclusión, para conteo, nos permite calcular
|E ∪T ∪C ∪D| = |E|+|T |+|C|+|D|−|E ∩T |−|E ∩C|−|E ∩D|−|T ∩C|−|T ∩D|−|C ∩D|+
|E ∩ T ∩C| + |E ∩ T ∩ D| + |E ∩C ∩ D| + |T ∩C ∩ D| − |E ∩ T ∩C ∩ D|
Observaciones y cuentas:
X Cada muestra de 6 cartas contendrá como mínimo cartas de un palo, por tanto el evento
E ∩ T ∩C∩ D no tendrá elementos, es decir |E ∩ T ∩C ∩ D| = 0.
X |E| = 39 6 , porque estas muestras no contendrán cartas del palo de picas, es decir la
muestra proviene de las 39 cartas que constituyen las de los otros tres palos. Similarmente

39
|T | = |C| = |D| =
6
X |E ∩ T | = 26

6 , porque estas muestras no contendrán cartas ni del palo de picas ni del
palo de tréboles, es decir la muestra proviene de las 26 cartas que constituyen las de los
otros tres palos. Similarmente

26
|E ∩C| = |E ∩ D| = |T ∩C| = |T ∩ D| = |C ∩ D| =
6
X |E ∩ T ∩C| = |E ∩ T ∩ D| = |T ∩C ∩ D| = 13

6
Por tanto el número de muestras de 6 cartas, sacadas aleatoriamente de un mazo de 52 cartas,
sin orden y sin devolución, de manera que cada muestra tenga por lo menos una carta de cada
pinta es:

52 39 26 13
−4 +6 −4 = 8682544
6 6 6 6
Entonces la la probabilidad de sacar 6 cartas de un mazo de 52 cartas, de modo que se obtenga, por
lo menos, una carta de cada pinta es:
52 39 26 13

6 −4 6 +6 6 −4 6
52
≈ 42.65 %
6
2.3 Probabilidad condicional e independencia
2.8
Supongamos que en una encuesta aplicada a 100 individuos, seleccionados aleatoriamente; se

les preguntó si fumaban no. El resumen de los resultados de esta pregunta de la encuesta están
consignados en la siguiente tabla:
No Fuma Fuma Total

Mujeres 55 5 60
Hombres 32 8 40
87 13 100
a) Se elige al azar una persona de este grupo, cuál es la probabilidad de que sea fumadora?
b) Se elige al azar una persona de este grupo, cuál es la probabilidad de que sea fumadora,
si se sabe que es una mujer?
Veamos:
a) Del total de 100 personas solamente 13 son fumadoras, por tanto la probabilidad de que la
persona elegida al azar sea fumadora es:
13
= 0, 13 = 13 %
100
b) Como se sabe previamente, que la persona elegida al azar es mujer, entonces reducimos nuestro
espacio solamente a la clase “Mujeres”, que en número son 60. Por tanto la probabilidad de
que esta persona sea fumadora es:
5
= 0, 083 ≈ 8, 33 %
60
Definición 2.10
Sea (Ω, F, P) un espacio de probabilidad, y B ∈ F tal que P(B) > 0. Se define la medida de
probabilidad condicional de A ∈ F dado B por:
P(A ∩ B)
P(A|B) :=
P(B)
En la siguiente proposición establecemos que la medida de probabilidad condicional es efectivamente

una medida de probabilidad.
Proposición 2.9
Dado B ∈ F, la función
P( , B) : F −→ R
A −→ P(A|B)
es una medida de probabilidad sobre el espacio medible (Ω, F)
P(Ω ∩ B) P(B)
• P1: P(Ω|B) = = =1
P(B) P(B)
P(A ∩ B)
• P2: P(A|B) = ≥0
P(B)
• P3: Sea (A j )∞j=1 , una sucesión de eventos, disyuntos dos a dos, en F, entonces:
∞
[
∞
[
Aj ∩B = (A j ∩ B)
j=1 j=1
(Ai ∩ B) ∩ (A j ∩ B) = (Ai ∩ A j ) ∩ B = 0/ ∩ B = 0/
entonces la sucesión (A j ∩ B)∞j=1 es disyunta dos a dos, luego
S∞
∞
[ P( j=1 A j ∩ B) ∑∞j=1 P(A j ∩ B) ∞
P(A j ∩ B) ∞
P( A j |B) = = = ∑ = ∑ P(A j |B)
j=1
P(B) P(B) j=1 P(B) j=1
N
X Si A es un evento en el espacio de probabilidad (Ω, F, P), entonces A ∩ Ω = A y por tanto
P(A ∩ Ω)
P(A|Ω) = = P(A)
P(Ω)
La probabilidad P(A) se conoce como probabilidad total o probabilidad incondicional

del evento A.
P(A ∩ B)
X De la definición de medida de probabilidad condicional P(A|B) = , deducimos:
P(B)
P(A ∩ B) = P(A|B)P(B); P(A ∩ B) = P(B|A)P(A)
Las ecuaciones anteriores se llaman regla de multiplicación.
2.9
Supongamos que se tienen las siguientes probabilidades: P(A) = 0.3; P(B|A) = 0.75;
P(B|Ac ) = 0.2; P(C|A∩B) = 0.2; P(C|Ac ∩B) = 0.15; P(C|A∩Bc ) = 0.8; P(C|Ac ∩Bc ) = 0.9.
Entonces
9
X P(B|A) = P(B∩A)
P(A) ⇒ P(A ∩ B) = P(B|A)P(A) = 0.75 × 0.3 = 40
9
X P(C|A ∩ B) = 0.2 ⇒ P(C ∩ B ∩ A) = 0.2P(A ∩ B) = 0.2 × 40 = 0, 045, por tanto P(A ∩
B ∩C) = 0.045
X Como Bc ∩ C = Ω ∩ (Bc ∩ C) = (A ∪ Ac ) ∩ (Bc ∩ C) = (A ∩ Bc ∩ C) ∪ (Ac ∩ Bc ∩ C)
entonces P(Bc ∩C) = P(A ∩ Bc ∩C) + P(Ac ∩ Bc ∩C), entonces
P(Bc ∩C) = P(C|A ∩ Bc )P(Bc |A)P(A) + P(C|Ac ∩ Bc )P(Ac ∩ Bc )
Podemos generalizar la regla de multiplicación para más de dos eventos.
Proposición 2.10
Sea A1 , A2 , . . . , Am , m eventos del espacio de probabilidad (Ω, F, P), entonces
P(Am ∩Am−1 ∩. . .∩A2 ∩A1 ) = P(Am |Am−1 ∩Am−2 ∩. . .∩A2 ∩A1 )×. . .×P(A2 |A1 )×P(A1 )

P(Am ∩ Am−1 ∩ . . . ∩ A2 ∩ A1 ) = P Am ∩ (Am−1 ∩ . . . ∩ A2 ∩ A1 )
= P(Am |Am−1 ∩ Am−2 ∩ . . . ∩ A2 ∩ A1 ) × P(Am−1 ∩ . . . ∩ A2 ∩ A1 )

..
= .
= P(Am |Am−1 ∩ Am−2 ∩ . . . ∩ A2 ∩ A1 ) × . . . × P(A2 |A1 ) × P(A1 )
2.10
Consideremos un congreso internacional de probabilidad y sus aplicaciones a la ingeniería, en

el cual asisten 200 personas entre nacionales y delegaciones extranjeras. Supongamos que de
la delegación española vienen 20 participantes. Si de los 200 participantes se seleccionan al
azar 4, cuál es la probabilidad de que los cuatro sean de la delegación española?
Consideremos los eventos Ai “el i-ésimo seleccionado es de la delegación española”, para i = 1, 2, 3, 4,

tenemos que calcular P(A1 ∩ A2 ∩ A3 ∩ A4 ).
Veamos, por la proposición anterior:
P(A1 ∩ A2 ∩ A3 ∩ A4 ) = P(A1 )P(A2 |A1 )P(A3 |A1 ∩ A2 )P(A4 |A∩ A2 ∩ A3 )
por tanto
20 19 18 17
P(A1 ∩ A2 ∩ A3 ∩ A4 ) = × × × ≈ 7, 5 × 10−5 = 0, 000075
200 199 198 197
Veamos un ejemplo similar al anterior en el cual consideraremos las opciones de “muestreo con
reemplazo” y “muestreo sin reemplazo”, e induciremos el concepto de independencia entre eventos.
2.11
Una urna tiene 50 balotas idénticas salvo por su color, 20 son rojas y 30 son negras. Se
seleccionan tres balotas al azar de la urna, una por una. Cuál es la probabilidad de que las tres
bolas sean rojas?
Denotemos con Ai el eventos la bola sacada en la i-ésima extracción es roja, para i = 1, 2, 3.

Vamos a tener en cuenta si la balota tomada se regresa a la urna o no.
Con reposición:
Si en cada etapa de la extracción de balotas retornamos la balota, entonces:
20 20 20 8
P(A1 ∩ A2 ∩ A3 ) = × × = = 0, 064
50 50 50 125
Sin reposición:
Si en cada etapa de la extracción de balotas no retornamos la balota, entonces:
20 19 18
P(A1 ∩ A2 ∩ A3 ) = × × ≈ 0, 058
50 49 48
N
X Observemos que en este caso la probabilidad de cada evento, salvo el primero, es afectada
por la ocurrencia del evento o eventos anteriores, a diferencia del caso con reemplazo
donde la probabilidad de cada evento permanece invariable e igual a la del primer evento.
X Intuitivamente, si la ocurrencia del evento B no afecta la probabilidad de ocurrencia del
P(A ∩ B)
evento A, entonces P(A|B) = P(A). Esta ecuación implica = P(A), por tanto
P(B)
P(A ∩ B) = P(A)P(B). En este caso diremos que los eventos A y B son independientes.
Definición 2.11
Los eventos A y B son independientes, respecto de la medida de probabilidad P, si y solamente
si satisfacen la igualdad
P(A ∩ B) = P(A)P(B)
Los siguiente resultados generales de la medida de probabilidad condicional y la independencia son

relevantes en aplicaciones.
Proposición 2.11
Sean A y B eventos de un espacio de probabilidad (Ω, F, P)
a) Si P(B) > 0, entonces P(Ac |B) = 1 − P(A|B)
b) Si A y B son eventos independientes entonces también son eventos independientes:
A y Bc , Ac y B, Ac y Bc ; es decir P(A ∩ Bc ) = P(A)P(Bc ), P(Ac ∩ B) = P(Ac )P(B), y
P(Ac ∩ Bc ) = P(Ac )P(Bc )
c) El evento A es independiente del evento cierto Ω.
d) Si A y B son eventos mutuamente excluyentes entonces P(A|B) = 0, para B tal que
P(B) > 0
a) Como Ω = A ∪ Ac , entonces B = (A ∩ B) ∪ (Ac ∩ B) y para P(B) > 0 tendremos:

P[(A ∩ B) ∪ (Ac ∩ B)] P(A ∩ B) + P((Ac ∩ B)
1 = P(Ω|B) = P(A ∪ Ac |B) = =
P(B) P(B)
entonces
P(A ∩ B) P(Ac ∩ B)
1= + = P(A|B) + P(Ac |B)
P(B) P(B)
entonces
P(Ac |B) = 1 − P(A|B)
b) Si A y B son eventos independientes entonces
P(A ∩ B) = P(A)P(B)
Ahora bien
B = (A ∩ B) ∪ (Ac ∩ B) ⇒ P(B) = P(A ∩ B) + P(Ac ∩ B) ⇒ P(B) = P(A)P(B) + P(Ac ∩ B)
por tanto
P(B)−P(A)P(B) = P(Ac ∩B) ⇒ P(B)(1−P(A)) = P(Ac ∩B) =⇒ P(Ac ∩ B) = P(Ac )P(B)
es decir, los eventos Ac y B son independientes. Similarmente se demuestra que A y Bc son

eventos independientes.
Solo resta demostrar que los eventos Ac y Bc también son independientes. en efecto
Como (Ac ∩ Bc )c = A ∪ B, entonces P(Ac ∩ Bc ) = 1 − P(A ∪ B), luego

c c
P(A ∩ B ) = 1 − P(A ∪ B)

= 1 − P(A) + P(B) − P(A ∩ B)
= 1 − P(A) − P(B) − P(A)P(B)

= (1 − P(A)) − P(B)(1 − P(A))
= (1 − P(A))(1 − P(B))
= P(Ac )P(Bc )
c) P(A ∩ Ω) = P(A) = P(A) · 1 = P(A)P(Ω)

d) Si A y B son eventos mutuamente excluyentes entonces A ∩ B = 0, / luego P(A ∩ B) = 0, por
tanto P(A|B) = 0, para B tal que P(B) > 0
Si A y B son independientes y mutuamente excluyentes, entonces P(A)P(B) = 0, por tanto
P(A) = 0 o bien P(B) = 0.
El concepto de independencia, anteriormente definido, se puede extender para más de dos eventos.
Definición 2.12
Sea (A j )∞j=1 una sucesión de eventos en un espacio de probabilidad (Ω, F, P).
(A j )∞j=1 es independiente si y solo si para cualquier subsucesión finita, Ai1 , Ai2 , . . . , Aik con
k ≥ 2, de (A j )∞j=1 , se satisface la ecuación:
P(Ai1 ∩ Ai2 ∩ . . . ∩ Aik ) = P(Ai1 )P(Ai2 ) . . . P(Aik )
Es decir, cualquier pareja, tripla, cuadrupla, etcétera, de eventos de la sucesión debe satisfacer la
ecuación anterior.
2.12
Una urna tiene cuatro fichas rotuladas así: AAA, CAC, ACC y CCA. Se extrae aleatoriamente
una ficha. Considere los eventos:
X A1 el primer caracter de la ficha es C
X A2 el segundo caracter de la ficha es C
X A3 el tercer caracter de la ficha es C
entonces A1 = {CAC,CCA}, A2 = {ACC,CCA} y A3 = {CAC, ACC}
a) Los eventos A1 , A2 y A3 , son independiente dos a dos:
1 1 1
P(A1 ∩ A2 ) = = · = P(A1 ) · P(A2 )
4 2 2
1 1 1
P(A1 ∩ A3 ) = = · = P(A1 ) · P(A3 )
4 2 2
1 1 1
P(A2 ∩ A3 ) = = · = P(A2 ) · P(A3 )
4 2 2
b) Los eventos A1 , A2 y A3 , no son independiente tres a tres:
1 1 1
P(A1 ∩ A2 ∩ A3 ) = P(0)
/ = 0 6= · · = P(A1 ) · P(A2 ) · P(A3 )
2 2 2
2.13
Se lanza un dado legal dos veces. Consideremos los eventos

X A: “la suma de los puntos es 7”.
X B: “el primer lanzamiento sale 2”.
X C: “el segundo lanzamiento sale 5”.
entonces
6 1 6 1 6 1
P(A) = = ; P(B) = = ; P(C) = =
36 6 36 6 36 6
además
1
A∩B = {(2, 5)}; A∩C = {(2, 5)}; B∩C = {(2, 5)} =⇒ P(A∩B) = P(A∩C) = P(B∩C) =
36
por tanto los eventos A, B y C son independientes dos a dos. Sin embargo no son independientes
tres a tres porque
1
A ∩ B ∩C = {(2, 5)} =⇒ P(A ∩ B ∩C) =
36
pero
1 1 1 1
P(A) · P(B) · P(C) = · · = =⇒ P(A ∩ B ∩C) 6= P(A) · P(B) · P(C)
6 6 6 216
Proposición 2.12
Si la sucesión de eventos (A j )∞j=1 , en el espacio de probabilidad (Ω, F, P), es independiente
entonces es independiente por pares.
Para el caso de triplas de eventos se tiene la siguiente proposición que simplifica la implicación de
independencia por pares.
Proposición 2.13
Supongamos que los eventos A, B y C satisfacen las condiciones
P(X ∩Y ∩ Z) = P(X)P(Y )P(Z)
donde X, Y y Z son respectivamente, A o Ac , B o Bc , y C o Cc , entonces A, B y C son

independiente por pares.
En efecto, haremos la prueba para A y B, los otros dos casos son similares.
A ∩ B = A ∩ B ∩ Ω = A ∩ B ∩ (C ∪Cc ) = (A ∩ B ∩C) ∪ (A ∩ B ∩Cc )
entonces
P(A ∩ B) = P (A ∩ B ∩C) ∪ (A ∩ B ∩Cc )
= P(A ∩ B ∩C) + P(A ∩ B ∩Cc )
= P(A)P(B)P(C) + P(A)P(B)P(Cc )
= P(A)P(B)(P(C) + P(Cc ))
= P(A)P(B)
Ejercicio 2.1 Supongamos que los eventos A, B, C y D satisfacen las condiciones
P(X ∩Y ∩ Z ∩W ) = P(X)P(Y )P(Z)P(W )
donde X, Y , Z y W son respectivamente, A o Ac , B o Bc , C o Cc , y D o Dc entonces A, B, C y D

son independientes.
2.4 Probabilidades totales y regla de Bayes

En esta sección abordaremos dos resultados extremadamente importantes, tanto desde un punto de
vista teórico como práctico.
La idea es que la probabilidad de un evento puede, en muchos casos, descomponerse aditivamente
en términos de las probabilidades de otros eventos que completan todo el espacio muestral. Para
presentarlos necesitaremos del concepto de “partición” en el contexto de la teoría de probabilidad.
Definición 2.13
Sea (Ω, F) una colección de eventos de Ω, (Bα )α∈I ⊂ F con I 6= 0,
/ es una partición de Ω si y
solamente si satisface:
a) Para todo α, β ∈ I, α 6= β
Bα ∩ Bβ = 0/
b)
[
Bα = Ω
α∈I
Proposición 2.14
Sea (Ω, F) un espacio medible. Si (Bα )α∈I ⊂ F es una partición de Ω, y A ∈ F entonces:
[
A= (A ∩ Bα )
α∈I
Como A = A ∩ Ω, entonces aplicando la propiedad distributiva de la intersección sobre la unión

tenemos:
[ [
A = A∩( Bα ) = (A ∩ Bα )
α∈I α∈I
Proposición 2.15
Regla de las probabilidades totales
Sea {B1 , B2 , . . . , Bm } una partición en el espacio de probabilidad (Ω, F, P). Entonces:
a) Para todo evento A ∈ F
m
P(A) = ∑ P(A ∩ B j )
j=1
b) Si P(Bi ) > 0, para todo i = 1, 2, . . . , m, entonces para todo evento A ∈ F

m
P(A) = ∑ P(A|B j )P(B j )
j=1
Es claro que
m
[
m
[
A = A∩Ω = A∩ Bj = (A ∩ B j )
j=1 j=1
la colección (A ∩ B j )mj=1 es una partición de A. Entonces

a)
m
[
m
P(A) = P (A ∩ B j ) = ∑ P(A ∩ B j )
j=1 j=1
b) Consecuencia del principio de multiplicación para dos eventos P(A ∩ B) = P(A|B) · P(B):
m m
P(A) = ∑ P(A ∩ B j ) = ∑ P(A|B j ) · P(B j )
j=1 j=1
Veamos algunos ejemplos del teorema de las probabilidades totales.
2.14
Una empresa de soluciones electrónicas para seguridad industrial recibe un tipo de dispositivo
de tres proveedores distintos (el dispositivo es indistinguible luego de que es almacenado).
Proveedor A con una participación del 40 %, proveedor B con una participación del 35 %
y proveedor C con una participación del 25 %. Por anteriores pedidos el área de control de
calidad sabe el porcentaje de dispositivos defectusos que llega de cada proveedor, 2 % para el
proveedor A, 1, 5 % para el B y 1 % para el C.
La empresa recibe los lotes de dispositivos de los tres proveedores y los almacena.
a) Determine la probabilidad de que un dispositivo seleccionado al azar sea defectuoso.
b) Determine la probabilidad de que un dispositivo seleccionado al azar sea del proveedor
A si en la prueba técnica resultó defectuoso.
Denotemos con A el evento “el dispositivo es defectuoso”, B1 el dispositivo es del proveedor
A, B2 el dispositivo es del proveedor B, B3 el dispositivo es del proveedor C.
Por la información sabemos que:
P(B1 ) = 0, 40 P(B2 ) = 0, 35 P(B3 ) = 0, 25

P(A|B1 ) = 0, 02 P(A|B2 ) = 0, 015 P(A|B3 ) = 0, 01
a) P(A) = P(A|B1 )P(B1 ) + P(A|B2 )P(B2 ) + P(A|B3 )P(B3 )

P(A) = (0, 02)(0, 40) + (0, 015)(0, 35) + (0, 01)(0, 25) = 0, 01575 ≈ 1, 6 %
P(B1 ∩ A) P(A|B1 )P(B1 )
b) Como P(B1 |A) = = , entonces:
P(A) P(A)
0, 02 × 0, 40
P(B1 |A) = ≈ 51 %
0, 01575
Proposición 2.16 Regla de Bayes

Sea {B1 , B2 , . . . , Bn } una partición del espacio muestral Ω de una experimento aleatorio, tal
que para cada i, i = 1, 2, . . . , n, P(Bi ) > 0 entonces para cualquier evento A en Ω, tal que
P(A) > 0 se satisface
P(A|B j )P(B j )
P(B j |A) = n
∑i=1 P(A|Bi )P(Bi )
2.15
Un sistema de comunicación envía datos binarios (0 o 1) los cuales son detectados por quien
los recibe. Quien los recibe ocasionalmente comete errores y algunas veces un 0 que es enviado
es detectado como un 1 o un 1 enviado es detectado como un 0. Suponga que el sistema de
comunicación está descrito por el siguiente conjunto de probabilidades condicionales:
P(0 recibido|0 transmitido) = 0.95 P(1 recibido|0 transmitido) = 0.05

P(0 recibido|1 transmitido) = 0.10 P(1 recibido|1 transmitido) = 0.90
a) Suponiendo que 0s y 1s son igualmente probables de ser transmitidos, halle
P(0 recibido) y P(1 recibido).
b) Suponga que 0 es detectado por quien recibe. Cuál es la probabilidad que el bit transmi-
tido fuera 1?
c) Suponga que 1 es detectado por quien recibe. Cuál es la probabilidad que el bit transmi-
tido fuera 0?
d) Cuál es la probabilidad que el bit detectado no sea el mismo que el bit transmitido?
1
a) Es claro que P(0 trans) = 2 y P(1 trans) = 21 . Entonces aplicando el Teorema de Probabili-
dades totales tenemos:
P(0 recib) = P(0 recib|0 trans)P(0 trans) + P(0 recib|1 trans)P(1 trans)
1 1
P(0 recib) = 0.95 × + 0.10 × = 0.525
2 2
De manera similar
P(1 recib) = P(1 recib|0 trans)P(0 trans) + P(1 recib|1 trans)P(1 trans)
1 1
P(1 recib) = 0.05 × + 0.90 × = 0.475
2 2
b) Aplicando el Teorema de Bayes:
P(0 recib|1 trans)P(1 tans) 0.10 × 12
P(1 trans|0 recib) = = = 0.0952381
P(0 recib) 0.525
c) Aplicando el Teorema de Bayes:
P(1 recib|0 trans)P(0 tans) 0.05 × 12

P(0 trans|1 recib) = = = 0.05263158
P(1 recib) 0.47
d) La solución es la siguiente suma de probabilidades condicionales:
P(0 recib|1 trans) + P(1 recib|0 trans) = 0.10 + 0.05 = 0.15
Esta probabilidad se conoce como probabilidad total del error de recibir.
2.16
Pruebas clínicas: Falsos positivos.

Un diagnóstico clínico es un proceso médico para descubrir alguna enfermedad en un paciente,
acertando en los signos y síntomas de éste mediante una selección apropiada de pruebas,
exámenes, interpretación de resultados y conclusión. Es un proceso complejo, complicado,
que implica conocimiento y experiencia del médico o médicos tratantes. En este proceso, al
aplicar un test clínico, su efectividad en reconocer la presencia o ausencia de una enfermedad
no siempre es del 100 %, es decir puede ocurrir que el resultado de positivo sin que el paciente
tenga la enfermedad o que de negativo aún cuando el paciente tiene la enfermedad.
Al leer un artículo que trate de un estudio de una prueba diagnóstica, la presencia o ausencia de la
enfermedad tiene que ser determinada usando alguna fuente de información conocida como patrón
de referencia (que es una prueba diagnóstica que define la presencia de la enfermedad con la máxima
certeza conocida).
X Sensibilidad de la prueba (Se): se define como la proporción de individuos con la

enfermedad que tienen un resultado positivo de la prueba clínica:
Verdaderos positivos
Se =
Verdadero positivos + Falsos negativos
La sensibilidad de la prueba es la probabilidad condicional de tener una prueba clínica
positiva dado que la enfermedad está presente:
Se = P(T + |D+)
La sensibilidad también es conocida como la tasa de falsos-positivos. Observemos que
ésta es calculada solamente con la población de individuos con la enfermedad.
X Especificidad de la prueba (Sp): se define como la proporción de individuos sin la

enfermedad que tienen un resultado negativo de la prueba clínica:
Verdaderos negativos
Sp =
Verdadero negativos + Falsos negativos
La especificidad de la prueba es la probabilidad condicional de tener una prueba clínica
negativa dado que la enfermedad está ausente:
Sp = P(T − |D−)
La especificidad también es conocida como la tasa de verdaderos-negativos. Observe-

mos que ésta es calculada solamente con la población de individuos sin la enfermedad.
2.17
En el estudio diagnóstico de una determinada enfermedad, la probabilidad de que una persona

sana obtenga erróneamente un resultado positivo es de 0.05. La probabilidad de que una
persona enferma obtenga incorrectamente un resultado negativo es 0.002. La tasa global de la
enfermedad en la población sometida al estudio diagnóstico es del 1 %. Si una prueba da un
resultado positivo, ¿cuál es el probabilidad de que realmente tenga la enfermedad?
X Eventos:
Ω := {Personas en la población sometidas a la prueba diagnóstica }
D := {Tiene enfermedad}; + := {Resultado prueba clinica positiva}

X Tasa de falsos-positivos: P(+|Dc ) = 0.05
X Tasa de falsos-negativos: P(−|D) = 0.002
X Tasa de la enfermedad: P(D) = 0.01
X Calcular P(D|+).
P(D ∩ +) P(+|D) · P(D)

P(D|+) = =
P(+) P(+)
Ahora bien
P(+|D) = 1 − P(−|D) = 1 − 0.002 = 0.998
P(+) = P(+|D) · P(D) + P(+|Dc ) · P(Dc ) = 0.998 · 0.01 + 0.05 · (1 − 0.01) = 0.05948
Por tanto
0.998 · 0.01
P(D|+) = = 0.168
0.05948
Es decir Si una prueba diagnóstica de positiva, entonces la probabilidad de que el paciente
tenga la enfermedad es aproximadamente 16.8 %.
2.5 Independencia
Ejercicios 2.1
1) Un dado legal se lanza seis veces. Determinar las siguientes probabilidades:
a) Por lo menos dos resultados son iguales.
b) Todos los resultados son diferentes y la suma es superior a ocho.
c) La suma de los resultados es divisible por tres.
2) La caja 1 contiene 2 balotas rojas y 4 balotas azules, mientras que la caja 2 contiene 1 balota
roja y 1 balota azul. Se saca, aleatoriamente, una balota de la caja 1 y se coloca en le caja 2,
entonces una balota de la caja 2 es seleccionada aleatoriamente y colocada en la caja 1.
a) Determinar la probabilidad que la balota seleccionada de la caja 2 sea roja.
b) Determinar la probabilidad que la balota transferida de la caja 1 a la caja 2 sea roja si
se sabe que la balota transferida de la caja 2 a la caja 1 fue roja.
3) Supongamos que 41 personas participan en un concurso en el que se eligen tres ganadores
al azar. los el primer participante elegido gana $500, el segundo participante elegido gana
$400, y el el tercer concursante elegido gana $250.
a) ¿Cuántos resultados diferentes son posibles?
b) Si los tres ganadores reciben $250, ¿cuántos resultados diferentes son posibles?
4) La caja 1 contiene 2 balotas rojas y 5 balotas azules, mientras que la caja 2 contiene 1
balota roja y 2 balotaazul. Una balota es seleccionada aleatoriamente, de una de las cajas
seleccionada aleatoriamente.
a) Determinar la probabilidad que la balota seleccionada sea roja.
b) Determinar la probabilidad que la balota sea de la caja 2 sea roja si se sabe que la
balota seleccionada fue roja.
c) Sea R el evento la balota es roja y A el evento la balota proviene de la caja 2. ¿Son
independientes estos eventos?
5) Las componentes A, B1 y B2 , operaran independientemente en un sistema electrónico, como
se muestra en la siguiente figura
Las probabilidades de que las componentes, funcionen por diez días sin falla alguna, son
P(A) = 0.9, P(B1 ) = 0.8, P(B2 ) = 0.7. El sistema trabaja si A1 trabaja y si B1 ó bien B2
trabaja. Se supone que los tres componentes entran en funcionamiento al mismo tiempo
y que una componente deja de trabaja una vez que se le presenta una falla. Determine la
probabilidad de que el sistema funcione.
6) Una urna contiene 10 balotas numeradas del 1 al 10. Se extraen cinco balotas al azar y sin
reemplazo. Sea A el evento de que “exactamente dos se extraen bolas impares y ocurren en
sorteos impares de la urna”. ¿Cuál es la probabilidad del evento A?
7) Las componentes A, B1 y B2 , operaran independientemente en un sistema electrónico, como
se muestra en la siguiente figura
Las probabilidades de que las componentes, funcionen por una semana sin falla alguna,
son P(A) = 0.9, P(B1 ) = 0.9, P(B2 ) = 0.8. El sistema trabaja (es decir, trabaja sin falla)
si A1 trabaja y si B1 ó bien B2 trabaja. Se supone que los tres componentes entran en
funcionamiento al mismo tiempo y que una componente deja de trabaja una vez que se le
presenta una falla.
a) Determine la probabilidad de que el sistema funcione.
b) Suponga que la componente B1 falla en algún momento durante la semana. Halle la
probabilidad de que el sistema trabaje, sin falla, durante la semana.
8) Cuál de los siguientes dos eventos tiene la mayor probabilidad?
X Al menos un 6, al lanzar un dado legal cuatro veces.
X Al menos un doble seis, al lanzar un dado legal veinticuatro veces.
9) Un dado se carga de tal manera que la probabilidad de la cara con j puntos quede hacia
arriba es proporcional a j para j = 1, 2, 3, 4, 5, 6. En 6 lanzamientos independientes de este
dado, ¿cuál es la probabilidad de que cada cara aparezca exactamente una vez?
10) Una urna contiene 6 bolas rojas y 3 bolas azules. Se selecciona una bola en forma aleatoria
y se reemplaza por una bola del otro color. Una segunda bola es entonces seleccionada.
¿Cuál es la probabilidad de que la primera bola seleccionada sea roja, dado que la segunda
bola fue roja?
11) Una empresa de motocicletas tiene tres talleres de producción diferentes. El 5 % de las
motocicletas del taller 1, el 4 % del taller 2 y el 8 % del taller 3 han sido retiradas debido a
una falla en el embrague. Suponga que el 40 % de las motocicletas se producen en el taller 1,
el 35 % en el taller 2 y el 25 % en el taller 3. Si se ha retirado del mercado una motocicleta,
seleccionada al azar, Determinar:
a) la probabilidad de que provenga del taller 1.
b) la probabilidad de que provenga del taller 2.
c) la probabilidad de que provenga del taller 3.
12) Un convicto planea escapar de la prisión saliendo por el sistema de alcantarillado de la
prisión. Hay 4 alcantarillas en la prisión, pero solo una conduce al exterior. El prisionero
planea entrar en cada una de las alcantarillas al azar, sin volver a entrar nunca en una
alcantarilla fallida. ¿Cuál es la probabilidad de que el prisionero deba probar exactamente 1
alcantarilla? 2 alcantarillas?, 3 alcantarillas? 4 alcantarillas?

13) En un concurso se tienen cinco sobres enumerados con 3, 4, 5, 6 y 7, en una urna. Un
concursante saca un sobre, al azar, si obtiene un número primo entonces el gana ese número
al cuadrado en dólares, en caso de que el sobre seleccionado no sea primo entonces puede
sacar un segundo sobre (sin devolver el primero a la urna), entonces gana, en dólares, la
suma de los cuadrados de los dos números seleccionados. ¿Cuál es la probabilidad de que el
concursante gane 25 dólares?
14) Dos tipos diferentes de procedimientos quirúrgicos son empleados para cirugía de meniscos.
La probabilidad de que una rodilla operada por meniscos no se recupere en un mes es de
0.2 % si se emplea el método 1 en la cirugía. Cuando se utiliza el método 2, en la cirugía, la
probabilidad de que la rodilla no se recupere en un mes es 1.5 %. En un hospital el 40 % de
las cirugías de meniscos son realizadas con el método 1 y que el 60 % son realizadas con el
método 2. De las cirugías realizadas para meniscos, se selecciona un paciente al azar.
a) ¿Cuál es la probabilidad de que la rodilla de este paciente no se recupere después de
un mes de la cirugía?
b) Si la rodilla del paciente se recupere un mes después de la cirugía, ¿cuál es la probabi-
lidad de que se haya empleado el método 2?
15) Una computadora puede enviar cualquiera de los tres caracteres (A, B o C) a una impresora.
Durante cada transmisión, cada carácter tiene las mismas posibilidades de ser enviado. Sin
embargo, debido a errores de transmisión, es posible que la impresora no imprime el mismo
carácter que se transmite. La probabilidad de que una A sea impresa incorrectamente como
una B es 20 %. La probabilidad de que una C sea incorrectamente impresa como una B es
50 %. Otros errores de impresora son imposibles.
a) Suponga que dos caracteres son transmitidos independientemente. ¿Cuál es la probabi-
lidad que dos A sean impresas?
b) Suponga que un solo carácter fue transmitido. Si un B fue imprimido, ¿cuál es la
probabilidad de que un B se haya transmitido?
16) Una urna contiene 5 balotas rojas, 7 azules y 3 verdes. Se seleccionan 3 balotas al azar de la
urna. Dado que una de las balotas seleccionadas es azul, ¿cuál es la probabilidad de que las
otras dos balotas sean rojas?
17) Se lanza una moneda legal n veces. Sea A el evento obtenemos a lo más una cara y sea
B el evento obtenemos al menos una cara y al menos un sello. ¿Son los eventos A y B
independientes?. Explique.
18) Un paquete contiene m tarjetas, etiquetadas 1, 2, 3, . . . , m. Las tarjetas se reparten en orden
aleatorio, una por una. Dado que la etiqueta de la k-ésima tarjeta repartida es la que contiene
el número mayor en su etiqueta, de las primeras k tarjetas, ¿cuál es la probabilidad de que
también sea la del número mayor en su etiqueta de todo el paquete de tarjetas?
19) Dos amigos juegan de la siguiente manera: el primero lanza una moneda legal n + 1 veces,
mientras que el segundo lanza la moneda legal n veces. Demuestre que la probabilidad de
que el primero tenga más caras obtenidas que el segundo, es igual a 12 .
20) Una urna tiene 3 balotas rojas y una balota blanca. Otra urna tiene una balota roja y una
balota blanca. Se eligen tres balotas al azar sin reemplazo de la primera urna y se colocan
en la segunda urna. Luego se eligen dos balotas al azar y sin reemplazo de la segunda urna,
¿cuál es la probabilidad de que las dos balotas elegidas de la segunda urna sean rojas?
21) Seis niñas y seis niños se sientan en una fila que tiene 20 sillas. ¿Cuál es la probabilidad de
que se sienten en 12 sillas consecutivas si existen dos parejas (niña-niño),de manera que
cada pareja siempre se sientan la una al lado de la otra, pero las dos parejas no se sientan la
una al lado de la otra?
22) Diez invitados asistieron a una cena. El anfitrión había planeado dónde se sentaría cada
invitado, pero los invitados lo ignoraron y eligieron asientos al azar. Encuentre la probabi-
lidad de que como máximo dos invitados eligieron los asientos que el anfitrión les había
asignados.
Distribución de variables aleatorias
Medidas estadísticas de resumen
3 — Variables aleatorias
3.1 Distribución de variables aleatorias

En un gran número de aplicaciones, tanto en la ciencia como en la ingeniería, las mediciones u
observaciones de las cantidades estudiadas se expresan numéricamente, sin embargo cada vez que
se replica un experimento o se observa una manifestación de un fenómeno estas mediciones u
observaciones presentan variabilidad; esta variabilidad es capturada o modelada mediante variables
aleatorias.
Definición 3.1
Sea (Ω, F, P) un espacio de probabilidad. Una variable aleatoria es una función X de Ω a R
tal que el conjunto {ω ∈ Ω : X(ω) ∈ B} es un evento en F, para todo B ∈ B la colección de
conjuntos de Borel en R
3.1
Experimento lanzar un dado legal. Consideremos las variables aleatorias:

(
−1 si ω ∈ {1, 3, 5}
X1 (ω) = ω; X2 (ω) =
1 si ω ∈ {2, 4, 6}
aplicaciones del espacio muestral Ω = {1, 2, 3, 4, 5, 6} a R.
X Si solamente tenemos información sobre si el resultado del lanzamiento es impar o
par, representado por la σ -algebra F := {0,/ Ω, {1, 3, 5}, {2, 4, 6}}, entonces podemos
determinar a X2 pero no a X1 . Es decir, X2 es medible respecto de F, pero X1 no es
medible respecto de F
X Al tener información sobre el valor del resultado que aparece en el lanzamiento del dado,
información representada por la σ -algebra F = 2Ω , entonces X1 y X2 son medibles
respecto de F.
54 Variables aleatorias
N El conjunto de todos los valores de la variable aleatoria X, se llama el rango de X y se denotará

por RX .
Las variables aleatorias nos permitirán medir eventos, mediante atributos numéricos. Presentaremos
algunos ejemplos.
3.2
Consideremos el experimento “lanzar una moneda legal dos veces”, queremos medir el
número de caras que salen.
El espacio muestral es Ω = {(C,C), (C, S), (S,C), (S, S)}, y la medida de probabilidad es la medida
equiprobable, es decir los eventos elementales C, S, tienen igual probabilidad P(C) = P(S) = 12 .
Consideremos la variable aleatoria X definida como “número de caras” que salen, por tanto X toma
los valores 0, 1, 2, una posible representación de la variable aleatoria X es mediante una tabla de
valores:
Resultados Valores de X
CC 2
CS 1
SC 1
SS 0
O una tabla más compacta es:
Valor de X Evento
2 {CC}
1 {CS, SC}
0 {SS}
Entonces podemos asignar las siguientes probabilidades a los valores de X:

X P(X = 0) = P({SS}) = 41
X P(X = 1) = P({CS, SC}) = 42
X P(X = 2) = P({CC}) = 41
Mediante esta representación podemos contestar interrogantes como ¿cuál es la probabilidad de que
salga por lo menos una cara?, ¿cuál es la probabilidad de que a lo más una cara?, cuyas respuestas
vienen dadas por P(X ≥ 1), P(X ≤ 1), es decir
1 1 3
P(X ≥ 1) = P({CS, SC,CC}) = P({CS, SC}∪{CC}) = P({CS, SC})+P({CC}) = P(X = 1)+P(X = 2) = + =
2 4 4
1 1 3
P(X ≤ 1) = P({SS,CS, SC}) = P({SS}∪{CS, SC}) = P({SS})+P({CS, SC}) = P(X = 0)+P(X = 1) = + =
4 2 4
La notación {X ≤ 1} significa {ω ∈ Ω : X(ω) ≤ 1} y {ω ∈ Ω : X(ω) ≤ 1} = {SS,CS, SC}
N Sea X una variable aleatoria definida sobre Ω y B ⊂ R, entonces

X {X ∈ B} := {ω ∈ Ω : X(ω) ∈ B} y P(X ∈ B) = P({ω ∈ Ω : X(ω) ∈ B})
X Si B = [a, b), entonces {X ∈ [a, b)} := {ω ∈ Ω : a ≤ X(ω) < b} y
P(a ≤ X < b) = P({ω ∈ Ω : a ≤ X(ω) < b})
X Si B = (a, b], entonces {X ∈ (a, b]} := {ω ∈ Ω : a < X(ω) ≤ b} y
P(a < X ≤ b) = P({ω ∈ Ω : a < X(ω) ≤ b})
X Si B = (a, ∞), entonces {X ∈ (a, ∞)} := {ω ∈ Ω : X(ω) > a} y
P(X > a) = P({ω ∈ Ω : X(ω) > a})
X Si B = (−∞, b], entonces {X ∈ (−∞, b]} := {ω ∈ Ω : X(ω) ≤ b} y
P(X ≤ b) = P({ω ∈ Ω : X(ω) ≤ b})
X Si B = {x0 } entonces escribiremos {X = x0 } en lugar de {X ∈ {x0 }}, y en consecuencia

P(X ∈ {x0 }) se simplificará a P(X = x0 )
Proposición 3.1
Si B = (a, b], a < b, entonces P(X ∈ B) = P(a < X ≤ b) = P(X ≤ b) − P(X ≤ a)
Basta observar que
(−∞, b] = (−∞, a] ∪ (a, b], (−∞, a] ∩ (a, b] = 0/
por tanto
P(X ≤ b) = P(X ≤ a) + P(a < X ≤ b) =⇒ P(a < X ≤ b) = P(X ≤ b) − P(X ≤ a)
3.3
Consideremos el experimento “lanzar un dado legal dos veces”, el espacio muestral es
Ω := {1, 2, 3, 4, 5, 6} × {1, 2, 3, 4, 5, 6} = {(i, j) : i, j = 1, 2, 3, 4, 5, 6}
la medida de probabilidad sobre la colección de eventos en Ω es la equiprobable. Consideremos

la variable aleatoria S “suma de los resultados” entonces RS = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
y las probabilidades asociadas a X son
Valores de S 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
Probabilidad 36 36 36 36 36 36 36 36 36 36 36
La gráfica de esta distribución de probabilidades es la siguiente:

3.4
Un experimento tiene espacio muestral Ω = {0, 1, 2} con medida de probabilidad dada por
P({0}) = 16 , P({1}) = 31 , P({2}) = 21 .
a) Hallar los valores que toman las siguientes variables:
I ) X = 2ω
II ) Y = ω 2
1
III ) Z = ω+1
b) Determine el valor de las siguientes probabilidades
I ) P(X < 4)
II ) P(0 < Y < 2)
III ) P(Z ≤ 0.5)
a) Los valores que toman las variables:

I ) X son {0, 2, 4}
II ) Y son {0, 1, 4}
III ) Z son {1, 21 , 31 }
b) Valor de las probabilidades
I ) P(X < 4) = P(X = 0) + P(X = 2) = P({0}) + P({1}) = 16 + 13 = 12
II ) P(0 < Y < 2) = P(Y = 1) = P({1}) = 31
III ) P(Z ≤ 0.5) = P(Z = 12 ) + P(Z = 31 ) = P({1}) + P({2}) = 13 + 12 = 56
Definición 3.2 Función de distribución

Sea X una variable aleatoria y x ∈ R. La Función de distribución de X, o función de distri-
bución acumulativa de X, se define por
FX (x) := P(X ≤ x)
La función de distribución FX satisface las siguientes propiedades.

Proposición 3.2
a) FX es una función no-decreciente, es decir si x1 < x2 entonces FX (x1 ) ≤ FX (x2 ).
b) 0 ≤ FX (x) ≤ 1
c) lı́mx→∞ FX (x) = 1
d) lı́mx→−∞ FX (x) = 0
e) P(a < X ≤ b) = FX (b) − FX (a)
f) P(X = b) = FX (b) − FX (b− )
g) P(X > a) = 1 − p(X ≤ a) = 1 − FX (a)
Definición 3.3
La variable aleatoria X es discreta si su rango RX está contenido en un conjunto contable
de R. La variable aleatoria X tiene una función masa de probabilidad, fmp, f : R −→ [0, 1]
definida por
f (k) := P(X = k)
La función masa de probabilidad satisface las siguientes propiedades.
Proposición 3.3
Sea X una variable aleatoria discreta con fmp f , entonces
a) Para todo k ∈ RX , 0 ≤ f (k) ≤ 1
b) ∑k∈RX f (k) = 1
3.5
Se va a conformar un jurado de 10 personas. El jurado se selecciona de un grupo de 25

potenciales jurados, compuesto por 15 mujeres y 10 hombres. Para la variable aleatoria X
número de mujeres en el jurado, construir la función masa de probabilidad.
Sea k el número de mujeres en el jurado, con k = 0, 1, 2, . . . , 10, entonces
15 10

k 10−k
f (k) = 25
, k = 0, 1, . . . , 10
10
3.6
Un examen consta de 20 preguntas de selección múltiple con respuesta única, cada pregunta
tiene 4 opciones de respuestas, de las cuales solo una es correcta. Supongamos que cada
pregunta del examen se responde de manera aleatoria; sea N la variable aleatoria “número de
preguntas correctamente contestadas”, entonces la función masa de probabilidad de N es:

k 20−k
20 1 3
f (k) = , k = 0, 1, 2, . . . , 20
k 4 4
Proposición 3.4
Si X es una variable aleatoria con función masa de probabilidad f (k), entonces
F(k) = ∑ f ( j)
j≤k
3.7
La variable aleatoria X, con rango RX = {1, 2, 3, 4, 5}, tiene función masa de probabilidad:
f (k) = C(3k − 2)
a) Determinar el valor de la constante C.

b) Hallar la Función de distribución de X
a) Como ∑5k=1 f (k) = 1, entonces
5 5
1
∑ C(3k − 2) = C ∑ (3k − 2) = C(45 − 10) = 35C ⇒ C = 35
k=1 k=1
por tanto
3k − 2
f (k) = , k = 1, 2, 3, 4, 5
35
b) Función de distribución de X
k
F(k) = ∑ f ( j)
j=1
entonces

1

 35
 si k = 1
5

si k = 2


 35

F(k) = 12
si k = 3
 35
 22


 35 si k = 4

 35

si k = 5
35
Proposición 3.5
Si el rango de la variable aleatoria discreta está dado por el conjunto finito ordenado RX =
{x1 , x2 , . . . , xn }, donde x j < x j+1 , para todo j = 1, 2, . . . n − 1, entonces
f (x1 ) = F(x1 )
f (x2 ) = F(x2 ) − F(x1 )
f (x3 ) = F(x3 ) − F(x2 )
..
.
f (xn ) = F(xn ) − F(xn−1 )
Definición 3.4
Una variable aleatoria X es continua si su función distribución FX se puede expresar como
Z x
FX (x) = f (t)dt, x ∈ R
−∞
para alguna función f : R −→ [0, ∞); esta función f se llama función de densidad de proba-
bilidad, fdp, de la variable aleatoria X.
Proposición 3.6
a) Si la fdp f es integrable entonces la función distribución F es continua.
b) Si la fdp f es continua en t = c ≤ x, entonces F es derivable en c y F 0 (c) = f (c)
3.8
Ejemplos de funciones de densidad de probabilidad y su función de distribución.

a) (
λ e−λ x x > 0
f (x) =
0 x<0
es una función de densidad de probabilidad, para λ > 0, y su función de distribución es
(
0 x≤0
F(x) = −λ x
1−e x>0
b) (
1
b−a a<x<b
f (x) =
0 otro caso
es una fdp para a < b, y su función de distribución es:


0

 x≤a
F(x) = b−a x−a
a≤x≤b


1 x>b
c)
1 − (x−µ)2
f (x) = √ e 2σ 2
2π
x ∈ R, para µ ∈ R y σ ∈ R+ , constantes. Su función de distribución es
Z x (t−µ)2
1
F(x) = √ e− 2σ 2 dt
−∞ 2π
3.2 Medidas estadísticas de resumen

Cuando tratamos información con una amplio conjunto de datos, es deseable resumir esta información
en algunos valores que la representen y que sean significativos.
Definición 3.5
Sea X una variable aleatoria con función masa de probabilidad f , entonces el valor esperado
de X, o esperanza de X, se define por
E[X] = ∑ k f (k)
k∈RX
siempre que este valor exista.
Definición 3.6
Sea X una variable aleatoria con función densidad de probabilidad f , entonces el valor
esperado de X, o esperanza de X, se define por
Z
E(X) = x f (x)dx
x∈RX
siempre que este valor exista.
Proposición 3.7
Si g : R −→ R es una función continua y X : Ω −→ R es una variable aleatoria, entonces
g ◦ X := g(X) es una variable aleatoria sobre Ω, y
Z
E(g(X)) = g(x) f (x)dx
x∈RX
siempre que esta integral exista.

Proposición 3.8
Si X es una variable aleatoria discreta con valor esperado finito, entonces
E[aX + b] = aE[X] + b
para todo par de constantes a y b.
En efecto
E[aX + b] = ∑ (ak + b) f (k)

k∈RX
= ∑ (ak f (k) + b f (k))

k∈RX
=a ∑ k f (k) + b ∑ f (k)
k∈RX k∈RX
= aE[X] + b · 1
= aE[X] + b
Proposición 3.9
Si X es una variable aleatoria continua con valor esperado finito, entonces
E[aX + b] = aE[X] + b
para todo par de constantes a y b.
Z
E[aX + b] = (ax + b) f (x)dx
x∈RX
Z
= (ax f (x) + b f (x))dx
x∈RX
Z Z
=a x f (x)dx + b f (x)dx
x∈RX x∈RX
= aE(X) + b
Otra medida de tendencia central central es la mediana

Definición 3.7
Sea X una variable aleatoria con fmp, o fdp, f . La mediana de f se define como
X El número real ξ tal que
1 1
P[X ≤ ξ ] ≥ y P[X ≥ ξ ] ≥
2 2
si X es una variable aleatoria discreta.
X El número real ξ tal que
1
Z ξ
P(X ≤ ξ ) = f (x)dx =
−∞ 2
si X es una variable aleatoria continua.
Definición 3.8
La moda de una variable aleatoria es el valor o valores de X que dan el máximo de la fmp o
de la fdp de X.
Una medida para la variabilidad o dispersión de una variable aleatoria X es la varianza denotada por
σX2 , donde σ > 0.
Definición 3.9
Sea X una variable aleatoria, la varianza de X se define por
σX2 := E((X − µ)2 )
donde µ := E(X)
Ejercicios 3.1
1. La variable aleatoria X tiene fdp
(
cxλ +1 (1 − x)λ 0 < x < 1
f (x) =
0 otro caso
donde c > 0 y 1 < λ < 2. Determine la moda de X.

( 2
3x
3 0≤x≤λ
f (x) = λ
0 otro caso
donde λ > 0
moda
a) Halle la razón
mediana
moda
b) Halle la probabilidad de que X sea menor que la razón
mediana
3. La función de distribución de la variable aleatoria X, para x > 0, está dada por
3
x j e−x
F(x) = 1 − ∑
j=0 j!
Hallar:
a) La fdp de X
b) El valor esperado y la varianza de X.
4. La variable aleatoria X tiene función de distribución
(
1 − e−x x > 0
F(x) =
0 otro caso
Hallar P(0 ≤ eX ≤ 4)
5. Sea X variable aleatoria con fdp
(
αx2 e−10x x ≥ 0
f (x) =
0 otro caso
con α > 0 una constante. Determine la probabilidad que X sea mayor o igual que su moda.
(
(λ + 1)x2 0 < x < 1
f (x) =
0 otro caso
siendo λ una constante. Determine la probabilidad que X se encuentre entre el primer y el

tercer cuartil.
7. Sea X una variable aleatoria con función de distribución F, continua. Determine la función
de distribución de la variable aleatoria Y := max{0, −X}
8. Sea X variable aleatoria con fmp dada por
2
f (x) = , x = 1, 2, 3, . . .
3x
a) Determine la probabilidad que X sea par
b) Determine el coeficiente de variación de X (que corresponde a la razón de su media a
su desviación estándar).
9. Sea X una variable aleatoria con fdp dada por
3
(
θ x + 32 θ 2 x2 0 < x < √1θ
f (x) =
0 otro caso
siendo θ > 0 una constante. Hallar

a) Determine el valor esperado y la varianza de X.
b) Determine el coeficiente de variación de X (que corresponde a la razón de su media a
su desviación estándar).
10. La función generadora de momentos de la variable aleatoria X está dada por

1
MX (t) =
t +1
Hallar el valor de E[(X − 2)3 ]

11. La función generadora de momentos de la variable aleatoria X está dada por
e3t
MX (t) = ; −1 < t < 1
1 − t2
Hallar el valor de E[(X − 3)2 ], ¿que representa este valor?

12. Considere la variable aleatoria X con función densidad de probabilidad dada por
e−|x|
f (x) = ; x∈R
2
a) Halle la función generadora de momentos de X
b) Determine el valor esperado y la varianza de X.
Modelo uniforme discreto
Modelo Bernoulli
Modelos binomial
Modelo geométrico
Modelo binomial negativo
MODELO HIPERGEOMÉTRICO
MODELO POISSON
4 — Modelos discretos
Consideraremos en este capitulo variables aleatorias X definidas en un espacio de probabilidad

(Ω, F, P), cuyo rango es un conjunto contable, es decir variables aleatorias discretas:
X : Ω −→ R
tal que RX := {x1 , x2 , . . . , xn }, o bien RX := {x1 , x2 , . . .}
4.1 Modelo uniforme discreto
Se considera un experimento aleatorio arbitrario, y se observa una característica numérica que toma
un número finito de valores, {x1 , x2 , . . . , xn }, que por simplicidad los tomaremos como {1, 2, . . . , n},
todos con la misma probabilidad, es decir la función masa de probabilidad de X está dada por:
(
1
n, si x = k, k = 1, 2, . . . , n
P(X = x) =
0, si x 6= k, k = 1, 2, . . . , n
66 Modelos discretos
La Función de distribución de X, está dada por



0, si x < 1
1

n, si 1 ≤ x < 2





2,

si 2 ≤ x < 3
n
P(X = x) = .

.
.


n−1
si n − 1 ≤ x < n

n ,





1, si n ≤ x
X Valor esperado: E[X] = n+12

2
X Varianza: Var(X) = n 12−1
et + e2t + . . . + ent
X Función generadora de momentos: MX (t) =
n
4.2 Modelo Bernoulli 67
4.1
Considere el lanzamiento de un dado legal. La variable aleatoria que describe el número que
aparece en la cara superior del dado es uniforme discreta con fmp:
1
P(X = j) = , j = 1, 2, 3, 4, 5, 6
6
4.2
De una baraja española, que tiene 40 cartas distribuidas en 4 palos: espadas, oros, copas y
bastos (cada palo tiene cartas del 1 al 7 junto con tres figuras 10, 11 y 12). Al tener el mazo
de naipes bien barajado y seleccionar una carta al azar, la variable aleatoria que describe la
carta extraída es uniforme discreta con fmp:
1
P(X = j) = , si j = 1, 2, . . . , 40
40
4.2 Modelo Bernoulli

Definición 4.1
Una prueba o ensayo de Bernoulli es un experimento o fenómeno aleatorio cuyos resultados
dan lugar a exactamente dos eventos elementales, uno llamado éxito y el otro fracaso.
Definición 4.2
Una variable aleatoria definida sobre el espacio muestral de un ensayo de Bernoulli, y que
toma los siguientes valores:
(
1, si el resultado es éxito
X=
0, si el resultado es fracaso
se llama modelo Bernoulli
X Función masa de probabilidad:

(
p, si k = 1
P(X = k) =
q, si k = 0
donde q := 1 − p.
X Valor esperado: E[X] = p
X Varianza: Var(X) = pq
X Función generadora de momentos: MX (t) = q + pet
X Notación: X ∼ B(1, p)
4.3
Un dado es cargado de manera que las caras del dado con número par de puntos tienen el doble
de probabilidad de salir que las caras con número impar. Si la variable aleatoria X modela si
el número que sale en la cara superior del dado, en un lanzamiento, es impar. Determine el
valor esperado de X.
En este caso el evento éxito corresponde a que salga un número impar, de esta manera la variable
aleatoria tomara dos valores posibles: 1 si en el dado sale un número impar y 0 si en el dado sale un
número par de puntos, en consecuencia la fmp para X es:
(
1
, si k = 1
P(X = k) = 32
3 , si k = 0
1
por tanto E(X) = ∑1k=0 kP(X = k) = 0 · P(X = 0) + 1 · P(X = 1) =
3
4.4
Una pregunta de un examen de selección múltiple cuenta con cuatro respuestas posibles,
una sola de las cuales es correcta y las otras tres son incorrectas. Sea X la variable aleatoria
definida como 1 si la respuesta seleccionada es la correcta y 0 si las respuesta seleccionada es
incorrecta en una pregunta. Entonces la fmp de X es:
(
1
si k = 1
P(X = k) = 43
4 si k = 0
4.3 Modelos binomial

Definición 4.3
Un modelo binomial consiste de la repetición de un ensayo Bernoulli, un número finito de
veces, bajos las mismas condiciones en cada repetición.
Definición 4.4
La variable aleatoria X que mide el número de éxitos en un modelo binomial con n repeticio-
nes del ensayo Bernoulli, se llama variable binomial.
X La función masa de probabilidad de X está definida por:

(
n k n−k
p q , si k = 0, 1, 2, . . . , n
P(X = k) := k
0, en los demás casos
X Valor esperado: E[X] = np

X Varianza: Var(X) = npq

X FGM: MX (t) = (q + pet )n
Funciones en el programa R
A continuación referenciamos las funciones más importantes del modelo Binomial que el programa
R tiene implementadas:
Función Características
dbinom(x,size,prob,log=F) Devuelve el valor de la fmp
pbinom(q,size,prob,lower.tail=T,log.p=F) Devuelve el valor de la FD
qbinom(p,size,prob,lower.tail=T,log.p=F) Devuelve el cuantil q
rbinom(n,size,prob) Devuelve un n-vector valores binomiales aleatorios
Las gráficas de la función masa de probabilidad del modelo binomial X ∼ Bin(n = 10, p = 0.6) y su
función de distribución, se muestra a continuación:
4.5
Un examen de selección múltiple con respuesta única consta de 20 preguntas independientes.

Cada pregunta tiene 5 opciones de respuesta, una sola de las cuales es correcta. Si una persona
que presenta el examen, responde cada pregunta seleccionando aleatoriamente la respuesta,
cuál es la probabilidad de aprobar el examen si éste se aprueba respondiendo bien el 70 % o
más de las preguntas?
El modelo es binomial ya que cada pregunta es un ensayo de Bernoulli (“éxito” si responde bien,
“fracaso” si responde mal), cada respuesta es seleccionada con independencia de lo seleccionado en
el resto.
Sea X la v.a. “número de preguntas bien contestadas”, entonces X ∼ B(n = 20, p = 0.2). La solución
al interrogante de aprobar el examen es:
20

20
P(X ≥ 14) = ∑ (0.2)k (0.8)20−k ≈ 1.85 × 10−6
k=14 k
4.6
Un reconocido médico asegura que el 60 % de los pacientes que padecen de cáncer de pulmón
son fumadores habituales. Aceptando que la afirmación de este médico es verdadera hallar la
probabilidad que:
a) de 10 pacientes recientemente admitidos al hospital, menos de la mitad son fumadores
habituales.
b) de 20 pacientes recientemente admitidos al hospital, menos de la mitad son fumadores
habituales.
En ambos casos estamos frente a un modelo binomial, en el primer caso n = 10 y en el segundo

n = 20 y en ambos casos la probabilidad de éxito (pacientes con la característica de fumadores
habituales) es p = 0.6, por tanto
a) X ∼ B(n = 10, p = 0.6), con X “número de pacientes fumadores habituales” la respuesta a la
pregunta es:
4
10
P(X ≤ 4) = ∑ (0.6)k (0.4)10−k ≈ 0.17
k=0 k
b)
9
20
P(X ≤ 9) = ∑ (0.6)k (0.4)20−k ≈ 0.13
k=0 k
Proposición 4.1
Sea X una variable aleatoria binomial con parámetros n y p, 0 < p < 1, y función masa de
probabilidad p(x). Entonces p(x) es máxima para x = b(n + 1)pc
a
a El símbolo bmc indica el mayor número entero que es menor o igual a m
Observemos que
n! k n−k
p(k) k!(n−k)! p (1 − p)
= n!
p(k − 1) (k−1)!(n−k+1)! p
k−1 (1 − p)n−k+1
(n + 1)p − k
= +1
k(1 − p)
Esta igualdad
p(k) (n + 1)p − k
= +1
p(k − 1) k(1 − p)
implica que p(k) > p(k −1) si y solamente si (n+1)p−k > 0, es decir si y solamente si k < (n+1)p.
De esta manera cuando k cambia de 0 a b(n + 1)pc, entonces p(k) crece y cuando k cambia
de b(n + 1)pc a n, entonces p(k) decrece, por consiguiente el máximo valor de p(k) ocurre en
k = b(n + 1)pc
4.7
Un jugador de fútbol erra tiros desde el punto penal con probabilidad 0.65. Determine el o
los valores de k para el cual, k goles en diez tiros desde el punto penal es máximo, y halle su
probabilidad.
Cada tiro desde el punto penal es un ensayo Bernoulli: hace gol (éxito) con probabilidad 0.35 o no
hace gol (fracaso) con probabilidad 0.65. Cada disparo desde el punto penal es independiente del
disparo anterior y del resto de disparos que se han dado, por tanto tenemos un modelo binomial
donde X, la variable aleatoria mide el número de goles hechos en 10 tiros; es decir X ∼ Bin(n =
10, p = 0.65), entonces el valor
máximo probable se obtiene en k = b(10 + 1)0.65c = 7 y su valor
10
de probabilidad es p(7) = 7 (0.65) (0.35)3 ≈ 0.25
7
Ejercicios 4.1
1. En cierta localidad de una ciudad, la necesidad por conseguir dinero para comprar droga es
establecida como la razón principal para el 75 % de todos los robos. Hallar la probabilidad
que entre los siguientes cinco casos de robo en esta localidad,
a) exactamente 2 resulten de la necesidad para adquirir droga.
b) a lo más 3 resulten de la necesidad para conseguir dinero para comprar droga.
2. Se lanza un dado legal 5 veces. Un éxito es cuando la cara superior del dado muestra un
número primo. Determinar la probabilidad de obtener tres números primos.
3. Supongamos que en una caja de 100 chips de computadora, la probabilidad de que un chip
sea defectuoso es del 3 %. El proceso de inspección para chips defectuosos consiste en
seleccionar al azar de la caja 5 chips, con reemplazo; la caja se envía si ninguno de los cinco
chips está defectuoso.
a) Escriba la variable aleatoria de interés.
b) Escriba la fmp de la variable aleatoria definida.
c) Determine la probabilidad de que la caja de chips sea enviada.
4. Suponga que 40 % de los potenciales votantes de una ciudad están en favor de colocar vallas
publicitarias mostrando los individuos corruptos. Suponga que se seleccionan al azar 5
potenciales votantes de la ciudad. Hallar la probabilidad de que:
a) 2 estén a favor.
b) menos de 4 estén a favor.
c) al menos uno esté a favor.
5. Un estudiante toma un test consistente de 10 preguntas de verdadero-falso.
a) Cuál es la probabilidad que el estudiante responda correctamente al menos 6 preguntas?
b) Cuál es la probabilidad que el estudiante responda a lo más 3 preguntas correctamente?
6. Un estudio de salud muestra que el 25 % de personas con edades entre 50 y 60 años, en cierta
ciudad, tienen presión arterial alta. Cuál es la probabilidad que en una muestra aleatoria de
20 personas con edades entre 50 y 60, más de 15 tengan presión alta.
7. Un sistema de comunicación consiste de n componentes, cada una de las cuales funcio-
nará, independientemente del resto con probabilidad p. El sistema completo funcionará
efectivamente si al menos la mitad de sus componentes funciona.
a) Determine los valores de p para los cuales un sistema de 5 componentes operará más
efectivamente que un sistema de 3 componentes.
b) En general, en que caso o casos un sistema de 2k + 1 componentes funcionará más
efectivamente que un sistema con 2k − 1 componentes?
8. Se sabe que los tornillos producidos por una determinada compañía serán defectuosos con
probabilidad 0.01, independientemente el uno del otro. La compañía vende los tornillos
en paquetes de 10 y ofrece una garantía de devolución de dinero si en el paquete hay no
más de un tornillo defectuoso. ¿Qué proporción de paquetes vendidos debe reemplazar la
compañía?
9. El siguiente juego, conocido como la rueda de la fortuna (o chuck-a-luck), es bastante
popular en muchos carnavales y casinos de juego: un jugador apuesta en uno de los números
del 1 al 6. Luego se lanzan tres dados, y si el número apostado por el jugador aparece i
veces, i = 1, 2, 3, entonces el jugador gana i unidades; si el número apostado por el jugador
no aparece en ninguno de los dados, entonces el jugador pierde 1 unidad. ¿Es este juego
justo para el jugador? (En realidad, el juego se juega haciendo girar una rueda que se
detiene en una ranura etiquetada por tres de los números del 1 al 6, pero esta variante es
matemáticamente equivalente a la versión de los dados.)
10. Supongamos que un rasgo particular (como el color de ojos o la zurdera) de una persona es
clasificados sobre la base de un par de genes, y supongamos también que d representa un
gen dominante y r un gen recesivo. Por lo tanto, una persona con genes dd es puramente
dominante, y una con rr es puramente recesivo, y uno con rd es híbrido. El puramente
dominante y los individuos híbridos son parecidos en apariencia. Los niños reciben un gen
de cada padre. Si, con respecto a un rasgo particular, dos padres híbridos tienen un total de
4 hijos, ¿Cuál es la probabilidad de que tres de los cuatro niños tengan la apariencia externa
del gen dominante?
11. Una empresa está considerando perforar cuatro pozos petroleros. La probabilidad de éxito
de cada pozo es de 40 %, independientemente de los resultados de cualquier otro pozo. El
costo de perforar cada pozo es de US$200, 000. Cada pozo que tenga éxito producirá un
ingreso de US$600.000 dólares.
a) ¿Cuál es la probabilidad que uno o más pozos sean productivos (exitosos)?
b) ¿Cuál es el número esperado de pozos productivos?
c) ¿Cuál es la ganancia esperada?
d) ¿Cuál es la ganancia si solamente un pozo resulta productivo?
12. Sea X la variable aleatoria “número de veces que aparece el 6” cuando se lanzan setenta y
dos dados legales. Determine el valor esperado de la variable aleatoria X 2 .
13. De experiencia pasada se sabe que cierta cirugía tiene una probabilidad del 90 % ser exitosa.
La cirugía se va a realizar en 30 pacientes. Sea X la variable aleatoria “número de cirugías
exitosas de las 30 realizadas.
a) Escriba la función masa de probabilidad de X.
b) ¿Cuál es la probabilidad de que la cirugía falle en el 20 % de los casos.
c) ¿Cuál es la probabilidad de que la cirugía sea exitosa en por lo menos el 75 % del total
de cirugías realizadas?.
14. Cuando un guepardo ataca a un impala en la estepa, tiene 60 % de probabilidad de cazarlo.
Dos guepardos apuntan de forma independiente al mismo impala. Encuentre la probabilidad
de que
a) ninguno de ellos atrape al impala.
b) solamente uno de los guerpardos atrape al impala.
c) ambos guepardos atrapen al impala.
15. En una sesión de identificación, a 6 testigos se les pide identificar al asesino entre 4 posibles
sujetos (uno de los cuales es el asesino). Si cada uno de los testigos elige al azar a uno de
los sujetos, determine la probabilidad de que
a) el asesino no sea seleccionado.
b) el asesino sea seleccionado por al menos uno de los testigos.
c) el asesino sea seleccionado a lo más por tres.
16. La probabilidad de hacer una venta, por linea telefónico, por parte de un vendedor de
televentas, es del 15 %. Hallar la probabilidad de que
a) ninguna venta sea hecha en 10 llamadas.
b) cuatro ventas sean hechas en 20 llamadas.
c) por lo menos ocho ventas sean hechas en 50 llamadas.
17. Una fabrica produce componentes, de las cuales se sabe que el 2 % son defectuosas. Las
componentes se empacan en cajas que contienen cien componentes. Se elige una caja al
azar.
a) ¿Cuál es la probabilidad de que no se encuentren unidades defectuosas?
b) ¿Cuál es la probabilidad de que se encuentren a lo más tres unidades defectuosas?
c) Un cliente recibe 20 cajas y hace una prueba de control de calidad de la siguiente

manera: del total de cajas recibido selecciona al azar dos cajas; de cada caja selecciona
diez componentes al azar y las pone a prueba, si encuentra dos o más componentes
defectuosos en ambas cajas, entonces devuelve todo el lote de las veinte cajas recibidas.
¿Cuál es la probabilidad de que se devuelva el lote de las veinte cajas?
18. Supongamos que el 80 % de los adultos con alergias reportan un alivio sintomático con
un medicamento específico. Si el medicamento se administra a 50 nuevos pacientes con
alergias, ¿cuál es la probabilidad de que sea eficaz en por lo menos treinta y cinco de ellos?
19. De un mazo de 52 cartas se selecciona al azar una carta, entonces se retorna al mazo, éste
se baraja correctamente, nuevamente se toma una carta al azar, se retorna al mazo el cual
es bien barajado; este proceso se repite 20 veces. ¿Cuál es la probabilidad que en todo el
proceso se extraigan 5 aces?
20. La probabilidad de que un paciente con un ataque cardíaco muera por esta es de 4 %.
Suponga que se tienen 10 pacientes que sufren un infarto.
a) ¿Cuál es la probabilidad de que todos sobrevivan?
b) ¿cuál es la probabilidad de que a lo más todos sobrevivan?
21. Un vendedor de seguros de salud sabe, por su experiencia que 3 de cada 20 personas
visitadas, adquiere el seguro. Cada visita a un cliente potencial es independiente del resto de
visitas. Determinar el número mínimo de clientes que debe visitar para que:
a) la probabilidad de vender por lo menos una póliza de seguros de salud sea del 75 %
b) la probabilidad de vender exactamente dos pólizas de seguros de salud sea por lo
menos 25 %
22. Suponga que cada día el precio de una acción, en la bolsa de valores, sube un octavo de
un punto con probabilidad 13 y baja un octavo de un punto con probabilidad 23 . Si el precio
de las acciones fluctúa aleatoriamente de un día a otro en forma independiente, cuál es la
probabilidad que después de seis días la acción tenga su precio inicial?
23. Del conjunto {x ∈ R : 0 ≤ x ≤ 1}, se seleccionan cien números en forma aleatoria y, se
redondean a tres cifras decimales. Cuál es la probabilidad de que al menos uno de ellos sea
igual a 0.345?
24. Cierto jugador de baloncesto hace un lanzamiento errado a la cesta con probabilidad 0.55.
Determine el valor de k para el cual k encestas en diez lanzamientos sea máximo, y halle su
máxima probabilidad.
25. Una pareja, mujer-hombre, quieren tener un 95 % de probabilidad de tener al menos un
niño y al menos una niña. Cuál es la cantidad mínima de hijos que deberían planear
tener?. Suponga que los eventos nacimiento de una niña y un niño son equiprobables e
independientes del género de otros niños nacidos en la familia.
26. Un sistema electrónico contiene tres componentes de refrigeración que operan independien-
temente. La probabilidad que cada componente falle es 0.05. El sistema se sobre-calentará
si y solamente si al menos dos componentes fallan.
a) Halle el valor esperado y la varianza del número de componentes que fallan.
b) Calcule la probabilidad que el sistema se sobrecaliente.
27. Cierto módem de conexión tiene una tasa de error de bit de canal de p = 0.01. Dado que los
datos se envían como paquetes de 100 bits, cuál es la probabilidad de que
a) solo 1 bit sea errado?

b) tres bits estén en error?
28. En la transmisión de un paquete de 128 bytes, los errores de un byte, ocurren independiente-
mente con probabilidad 19 . Determinar la probabilidad de que ocurran menos de cinco bytes
con error en el paquete de 128 bytes.
29. Se realiza una prueba para determinar la concentración de una sustancia química en un
herbicida que mata a las plantas de coca. Se encuentra que una concentración dada de la
sustancia química matará en promedio el 80 % de las matas de coca en un lapso de 24 horas.
Se realiza una prueba en 20 plantas de coca. Encontrar la probabilidad de que
a) exactamente 14 plantas no sobrevivan en 24 horas.
b) al menos 10 plantas de cocas mueran en 24 horas
30. Un fabricante de celdas secas fabrica dos baterías que parecen ser idénticas. Las baterías de
tipo A duran más de 600 horas con probabilidad 0.30 y las baterías de tipo B duran más de
600 horas con probabilidad 0.40.
a) ¿Cuál es la probabilidad de que 5 de cada 10 baterías tipo A duren más de 600 horas?
b) De 50 baterías tipo B, ¿cuántas se espera que duren al menos 600 horas?
c) ¿Cuál es la probabilidad de que tres baterías tipo A tengan más baterías que duren 600
horas que dos baterías tipo B?
4.4 Modelo geométrico
Definición 4.5
Un modelo geométrico se caracteriza por la repetición de un ensayo Bernoulli, en las mismas
condiciones, hasta alcanzar un éxito.
Definición 4.6
Sea X la variable aleatoria que mide el número de veces que se repite un ensayo Bernoulli
hasta alcanzar éxito por primera vez. El rango de este variable es Rank(X) = {1, 2, . . .}
X Función masa de probabilidad

(
qn−1 p, para n = 1, 2, . . .
P(X = n) =
1
X Valor esperado: E[X] =
p
q
X Varianza: Var(X) = 2
p
pet
X FGM: MX (t) =
1 − qet
4.8
La probabilidad que un bit transmitido por un canal de transmisión digital sea recibido
erradamente es 0.1. Suponga que las transmisiones son eventos independientes. Sea X la
variable aleatoria “número de bits transmitidos hasta que el primer bit errado ocurra”. Cuántos
bits, en promedio son transmitidos por el canal hasta que ocurra el primer error?
La variable aleatoria X se distribuye geométrica con parámetro p = 0.1, que es la probabilidad de

transmitir un bit errado. Luego su fmp es:
P(X = k) = (0.9)k−1 0.1
1
entonces su valor esperado es E[X] = 0.1 = 10, es decir el número esperado de bits transmitidos por
el canal hasta recibir el primero errado es 10.
Definición 4.7
La variable aleatoria X no tiene memoria si y solamente si verifica
P(X > s + t|X > s) = P(X > t), ∀s,t
Teorema 4.1 No memoria

Si X es una variable aleatoria geométrica, con parámetro p, entonces X no tiene memoria.
Observemos que
∞ ∞ ∞
1
P(X > k) = ∑ q j−1 p = p ∑ q j+k = qk p ∑ q j = qk p = qk
j=k+1 j=0 j=0 1−q
P(X > s + t)
P(X > s + t|X > s) =
P(X > s)
qs+t
=
qs
= qt
= P(X > t)
Teorema 4.2
Sea X una variable aleatoria discreta con rango {1, 2, . . .} y tal que para todo i, j ∈ Z+ X
verifica:
P(X > i + j|X > i) = P(X > j)
entonces X es una variable aleatoria geométrica.
De la condición dada es una consecuencia inmediata que X satisface

P(X > i + j) = P(X > i)P(X > j)
Tomando i = j = 1 obtenemos P(X > 2) = (P(X > 1))2 . Denotemos con la letra y la probabilidad
P(X > 1) entonces P(X > 2) = y2 ; de igual manera tenemos:
P(X > 3) = P(X > 2 + 1) = P(X > 2)P(X > 1) = y2 y = y3
Conjeturamos que para todo j, j = 1, 2, . . ., P(X > j) = y j . Probamos inductivamente que esta
conjetura es una proposición verdadera.
• La proposición es cierta para j = 1, j = 2, j = 3
• Hipótesis de inducción: para j = n es cierto que P(X > n) = yn
• Prueba de inducción: Demostrar que P(X > n + 1) = yn+1 . En efecto
P(X > n + 1) = P(X > n)P(X > 1) = yn y = yn+1
Ahora bien, como
∞
∑ P(X = k) = 1
k=1
entonces
∞
P(X = 1) + ∑ P(X = k) = 1
k=2
es decir
P(X = 1) + P(X > 1) = 1 ⇒ P(X = 1) + y = 1 ⇒ P(X = 1) = 1 − y
Entonces
P(X = k) = P(X > k − 1) − P(X > k) = yk−1 − yk = yk−1 (1 − y)
esto significa que la función masa de probabilidad de X es un modelo geométrico, por tanto
X ∼ geom(y)
N El modelo geométrico frecuentemente aparece en los siguientes términos:
La variable aleatoria X se define como “el número de fracasos previos a la ocurrencia del primer
éxito”.
Proposición 4.2
Si X es la variable aleatoria definida como “el número de fracasos previos a la ocurrencia del
primer éxito”, entonces:
a) La función masa de probabilidad es:
P[X = n] = qn p, n = 0, 1, 2, . . .
q
b) E[X] = p
q2 q
c) Var[X] = +
p2 p
Ejercicios 4.2
1. Una empresa de pedidos por correo envía una carta a sus clientes. La probabilidad de que
un cliente elegido al azar conteste a esa carta es de p = 15 %. Hallar:
a) La distribución de probabilidad del número X de cartas que debe enviar hasta recibir
una respuesta.
b) La esperanza y varianza de X
2. La probabilidad de una alineación óptica con éxito en el montaje de un producto óptico,
según especificaciones para su almacenamiento, es del 80 %. Suponga que los intentos de
montaje son independientes.
a) ¿Cuál es la probabilidad de que la alineación con éxito se produzca por primera vez en
el quinto ensayo?
b) ¿Cuál es la probabilidad de que la primera alineación con éxito requiera como mínimo
cuatro intentos?
c) ¿Cuál es la probabilidad de que la primera alineación con éxito requiera a lo menos
cuatro y a lo más 6 intentos?
d) ¿Cuántos intentos se espera realizar para lograr el primer éxito?
e) Calcular la desviación estándar del número de intentos hasta lograr éxito en la alinea-
ción.
3. Un científico inocula varias ratas, una a la vez, con un germen de cierta enfermedad hasta
lograr una que la haya contraído. Si la probabilidad de contraer la enfermedad es 51 ,
a) ¿Cuál es la probabilidad de que se requieran 8 inoculaciones hasta encontrar una rata
que haya contraído la enfermedad?
b) ¿Cuál es la probabilidad de que por primera vez a lo más en la cuarta inoculación se
encuentre una rata que haya contraído la enfermedad?
c) ¿Cuál es la probabilidad de que se requiera como mínimo cinco inoculaciones para
encontrar la primera rata que haya contraído la enfermedad?
d) ¿Cuál es la probabilidad de que se requiera a lo menos cuatro y a lo más seis inocula-
ciones para encontrar la primera rata que haya contraído la enfermedad?

e) ¿Cuántos intentos se espera realizar para encontrar la primera rata que haya contraído
la enfermedad?
f ) Calcular la desviación estándar del número de intentos hasta encontrar la primera rata
que haya contraído la enfermedad?
4. Un automóvil clásico de colección, con motor de carburador, da arranque con probabilidad
0.6. Cada intento de arranque es independiente de los demás intentos. Determine el menor
número de intentos requeridos previos, para que el automóvil encienda con una probabilidad
de 1.5 %
5. Desde el computador I se envía un mensaje al computador II a través de un enlace de
radio poco confiable. El mensaje está codificado para que II pueda detectar cuándo se han
introducido errores en el mensaje durante la transmisión. Si II detecta un error, solicita a
A que lo retransmita. Si la probabilidad de un error de transmisión de mensaje es del 18 %
¿Cuál es la probabilidad de que un mensaje deba transmitirse más de dos veces?
6. En un estudio clínico, los voluntarios son puestos a prueba de un gen que se ha encontrado
que aumenta el riesgo de contraer una enfermedad. La probabilidad de que una persona sea
portadora del gen es de 0, 05.
a) ¿Cuál es la probabilidad de tener que probar 4 o más personas para detectar un portador
del gen?
b) ¿Cuántas personas se espera probar para detectar un portador del gen?
7. Supongamos que cada una de las llamadas a una reconocida emisora de radio tiene una
probabilidad del 2 % de obtener conexión (es decir, de no obtener una señal de ocupado).
Suponga que las llamadas son independientes.
a) ¿Cuál es la probabilidad de que la primera llamada que se conecta la décima que se
realiza?
b) ¿Cuál es la probabilidad de que se requiera más de cinco llamadas para que usted
pueda conectarse?
c) ¿Cuál es el número medio de llamadas necesarias para conectarse?
8. En su viaje de cada mañana al trabajo, un semáforo particular está de color verde el 20 %
de las veces en que Julian se acerca en su vehículo a él. Supongamos que cada mañana
representa un evento independiente.
a) ¿Cuál es la probabilidad de que hayan pasado más de cinco mañanas hasta que Julian
se encuentre con el semáforo en verde?
b) ¿Cuál es la probabilidad de que hayan pasado veinte mañanas hasta que Julian se
encuentre con el semáforo en verde?
c) ¿Cuál es la probabilidad de que hayan pasado más de veinte mañanas hasta que Julian
se encuentre con el semáforo en verde?
d) ¿Cuál es la probabilidad de que la primera mañana en que la luz esté en verde sea la
cuarta mañana en que Julian se aproxima al semáforo?
9. Una empresa tiene un equipo computacional que utiliza para el comercio al exterior de su
región. La probabilidad de que el equipo falle en un día es de 0.005, y cuando falla el equipo
es reparado inmediatamente por la noche. Cada día es un evento independiente.
a) ¿Cuál es la probabilidad de que el equipo falle el primer día en que es puesto en
funcionamiento?
b) ¿Cuál es la probabilidad de que el equipo falle después del tercer día de funcionamien-
to? ¿Se puede estar tranquilo en la empresa al observar este resultado?
c) ¿Cuál es el número medio de días de buen funcionamiento hasta que el equipo falle?
10. En una operación de llenado automático, una báscula electrónica detiene la línea de fa-
bricación después de detectar un paquete de peso inferior al normal. Supongamos que la
probabilidad de que se produzca un paquete de bajo peso es de 0.001 y que el relleno de
cada uno es independiente.
a) ¿Cuál es el número medio de rellenos antes de que se detenga la línea de producción?
b) ¿Cuál es la desviación estándar del número de rellenos antes de que se detenga la línea
de producción?
11. La probabilidad de que una persona, que vive en un determinado lugar de la ciudad, sea
propietaria de un perro se estima en 0, 3. Encuentre la probabilidad de que una persona
entrevistada al azar en décimo lugar sea la primera propietaria de un perro en esa zona de la
ciudad
12. La probabilidad de que un alumno pase la prueba escrita para certificarse en control elec-
trónico, después de haber seguido un curso, es de 0, 7. Encuentre la probabilidad de que el
estudiante pase la prueba
a) en el tercer intento.
b) antes del cuarto intento
13. En el control de equipaje de un aeropuerto se sabe que el 3 % de las personas revisadas
tienen objetos ilegales en su equipaje.
optIon ¿Cuál es la probabilidad de que una cadena de 15 personas pase el control con éxito
antes de que pase un individuo con un objeto cuestionable?
optIIon ¿Cuál es el número esperado de individuos que pasan el control en una fila antes de
que un individuo detenga el proceso?
14. Suponga que la longitud de un carácter (en bits) es una distribución geométrica con paráme-
tro p. Suponga, además, que la longitud de caracteres son variables aleatorias independientes.
Cuál es la distribución del número total de los bits que forman un mensaje de k caracteres
aleatorios?
15. Mil doscientos huevos, de los cuales doscientos están con la cáscara quebrada, se distribuyen
aleatoriamente en cien cubetas para huevos, cada una conteniendo doce huevos. Estas cubetas
son vendidas a un restaurante. Cuántas cubetas deberían esperarse que el chef del restaurante
abra antes de hallar una cubeta sin huevos rotos?
16. 25 % de los automoviles exhibidos en un concesionario son automáticos. Un vendedor del
concesionario muestra los vehículos uno a continuación del otro, a potenciales compradores,
en forma aleatoria. Sea X la variable aleatoria “número de autos automáticos” que un
potencial comprador verá antes del primer vehiculo mecánico.
a) Cuál es la función masa de probabilidad de X?
b) Cuál es la función masa de probabilidad de la variable aleatoria Y = X + 1?
17. Como parte de un proceso de selección de personal para operar maquinaria de precisión, a
cada candidato se le realiza una prueba clínica de presión arterial. Sea X la variable aleatoria
“número de candidatos probados clínicamente hasta que la primera persona con presión
arterial alta aparece. El valor esperado de X es 12.5. Calcule la probabilidad que la sexta
persona probada clínicamente sea la primera candidata con presión arterial alta.
18. Un laboratorio computacional consistente de veinte computadores fue atacado por un virus
informático. Dicho virus ingresa a un computador con probabilidad 0.40, independientemen-
te del resto de los computadores. La ingeniera administradora responsable del laboratorio
examina cada computador, uno a uno para determinar si fue o no infectado por el virus.
Cuál es la probabilidad de que la ingeniera tenga que examinar al menos seis computadores
para hallar el primero infectado.
19. Una prueba de resistencia de la soldadura implica cargar juntas soldadas hasta que se
produzca una fractura. Para cierto tipo de soldadura, el 80 % de las fracturas ocurren en la
soldadura, mientras que el otro 20 % ocurren en la viga. Se prueban varias soldaduras y las
pruebas son independientes. Hallar la probabilidad de que se requieran por lo menos cinco
pruebas hasta obtener la primera viga fracturada.
20. Una red de laboratorio que consta de un cluster de 50 computadoras fue atacada por un
virus informático. Este virus ingresa a cada computadora con probabilidad 0.3, indepen-
dientemente de otras computadoras. El técnico responsable de la salade cómputo revisa
las computadoras del laboratorio, una tras otra, para ver si estaban infectadas por el virus.
¿Cuál es la probabilidad de que tenga que no tenga que probar más de 20 computadoras
para encontrar la primera computadora infectada?
21. Un estudiante travieso quiere entrar en un archivo de computadora, que está protegido con
contraseña. Suponga que que hay n contraseñas, solo una de las cuales es correcta, y que el
estudiante intenta contraseñas posibles en un orden aleatorio. Sea N el “número de pruebas
requeridas para entrar en el archivo”. Determinar la función masade probabilidad de N.
22. Los componentes informáticos idénticos se envían en cajas de 5. Alrededor del 15 % de los
componentes son defectuosos. Las cajas se prueban en un orden aleatorio.
a) ¿Cuál es la probabilidad de que una caja seleccionada al azar solo tenga componentes
no defectuosos?
b) ¿Cuál es la probabilidad de que al menos 8 de las 10 cajas seleccionadas al azar tengan
solo componentes defectuosos? componentes?
c) ¿Cuál es la distribución del número de cajas probadas hasta que se encuentra una caja
sin componentes defectuosos?
4.5 Modelo binomial negativo
Definición 4.8
Un modelo binomial negativo consiste en repetir un ensayo Bernoulli, bajo las mismas
condiciones en cada repetición, hasta alcanzar r éxitos.
Definición 4.9
La variable aleatoria X definida por: “número de repeticiones hasta alcanzar r éxitos” en un
modelo binomial, se distribuye binomial negativa, X ∼ BN(r, p),
X Función masa de probabilidad:
(
k−1

r−1 pr qk−r , para k = r, r + 1, . . .
P(X = k) :=
r
X Valor esperado: E[X] =
p
rq
X Varianza: Var[X] = 2
p
A continuación referenciamos las funciones más importantes del modelo Binomial Negativa que el
programa R tiene implementadas:
dnbinom(x,size,prob,mu,log=F) Devuelve el valor de la fmp
pnbinom(q,size,prob,mu,lower.tail=T,log.p=F) Devuelve el valor de la FD
qnbinom(p,size,prob,mu, lower.tail=T,log.p=F) Devuelve el cuantil q
rnbinom(n,size,prob,mu) Devuelve vector aleatorio binomiales negativos
La gráfica de la función masa de probabilidad del modelo binomial
X ∼ BN(r = 3, p = 0.7)
se muestra a continuación:
4.9
Una compañía petrolera realizó un estudio geológico respecto a hallazgo de petróleo. El

estudio indica que una exploración de petróleo (perforación) tendría una probabilidad del
20 % para extraer petróleo. Determinar la probabilidad que el segundo hallazgo de petróleo
ocurra en la quinta perforación.
Observemos que el problema establece como fijo el número de perforaciones exitosas (2) y como
variable el número de ensayos (las perforaciones), por tanto estamos en presencia de un modelo
binomial negativo.
Definimos la variable aleatoria X como “número de perforaciones necesarias para obtener exacta-
mente 2 hallazgos de petróleo”, en consecuencia tenemos que X ∼ BN(r = 2; p = 0.2), cuya fmp
es:

k−1
P(X = k) = (0.2)2 (0.8)k−2
2−1
es decir
P(X = k) = (k − 1)(0.2)2 (0.8)k−2 ⇒ P(X = 5) = 0.08192
Es decir, la probabilidad de que el segundo hallazgo de petróleo ocurra en la quinta perforación es

de aproximadamente 8.2 %.
Una manera alternativa de presentar el modelo binomial es la siguiente:
Se repite un ensayo de Bernoulli, siempre bajo las mismas condiciones, se pretende determinar el
número fallas previas hasta que el r-ésimo éxito ocurra.
Sea X la variable aleatoria “número de fallas previas a alcanzar el -ésimo éxito”. En orden a hallar
una expresión para la fmp de la variable aleatoria X necesitamos analizar el evento X = x.
El evento X = x significa que antes de la ocurrencia del r-ésimo éxito han ocurrido exactamente x
fallas, en consecuencia también han ocurrido r-1 éxitos, es decir antes del r-ésimo éxito se han hecho
x + r − 1 repeticiones del ensayo Bernoulli. Un argumento combinatorio nos permite establecer que
la manera de distribuir las x fallas en las x + r − 1 repeticiones es:

x+r−1
x
y por lo tanto la fmp de la variable aleatoria X es:

x+r−1 x r
P(X = x) = q p , para x = 0, 1, 2, . . .
x
Se deja como ejercicio demostrar que:
rq rq
E[X] = , Var[X] = 2
p p
4.10
En la unidad de tratamiento contra el dolor de la central de urgencias de un hospital se

desarrolla una investigación respecto de un nuevo farmaco contra el dolor (del cuál se ha
estimado que podría causar una reacción adversa en el 5 % de los pacientes a quienes se
les administre. El experimento de investigación consiste en tomar ciertos datos relevantes
a pacientes que llegan a la unidad y se termina cuando se atienda el décimo paciente que
presente reacción negativa al fármaco. Cuál es el número esperado de pacientes sin reacción
negativa al fármaco antes de recibir al décimo paciente con reacción adversa al fármaco.
Consideremos la variable aleatoria X definida por “número de pacientes sin reacción negativa al
fármaco contra el dolor previos al décimo paciente con reacción negativa al fármaco”, entonces
X ∼ BN(r = 5, p = 0.05)
y función masa de probabilidad

x + 10 − 1
P(X = x) = (0.95)x (0.05)10
x
por tanto el número esperado de pacientes, en la unidad, que no muestran reacción adversa al fármaco
previos a que se presente el paciente décimo con una reacción negativa al fármaco es:
10 × 0.95
= 190
0.05
Ejercicios 4.3
1. Tres personas lanzan, cada una, una moneda legal. De los tres el que obtenga un resultado
distinto invita a los tres un café. En caso de que las monedas muestren el mismo resultado,
vuelven a lanzar hasta obtener el desempate. Halle la probabilidad de que se requieran
menos de cuatro lanzamientos para terminar.
2. Un médico que se especializa en cirugía de mano derecha experimenta con ratones hasta
lograr un resultado óptimo en la cirugía (de acuerdo con protocolos médicos y éticos). En
dicho tipo de experimentación la probabilidad de alcanzar un resultado óptimo es del 25 %,
halle la probabilidad de que se requiera experimentar con ocho ratones.
3. Un estudio de inventario determina que, en promedio, las demandas de un artículo particular
en un almacén son hechas cinco veces por día Determine la probabilidad de que en un
determinado día este artículo sea solicitado:
a) más de diez veces.
b) ninguna vez.
c) exactamente cinco veces.
4. De acuerdo con estudios de Medicina Legal, cerca del 30 % de las personas que son hurtadas
diariamente han sido afectadas con alguna sustancia que inhibe su voluntad. Asumiendo
que este estudio es válido, halle la probabilidad de que en un día dado la quinta persona que
es llevada a Medicina Legal por hurto sea
a) la primera que ha sido drogada.
b) la tercera que ha sido drogada.
c) por cualquier otra causa distinta a ser drogada.
5. La probabilidad de que un estudiante obtenga un score de 80 puntos en la prueba TOEFL,
con una preparación laxa, es de 0.40. Si las condiciones de preparación se conservan,
determine la probabilidad de que el estudiante obtenga un puntaje de 80 puntos en esta
prueba:
a) en el primer intento.
b) en el quinto intento.
c) en el cuarto intento.
6. Una zona de descanso en carretera tienen una capacidad para tres vehículos (de un solo eje).
Determine la probabilidad de que esta zona esté llena, en un intervalo de tiempo de diez
minutos. Por estadísticas de movilidad de esta carretera se tiene estimado que seis carros
de un solo eje pasan por este espacio de descanso en lapsos de tiempo de diez minutos y,
que en promedio un 80 % de todos los autos de un eje desearán parquear en dicha zona de
descanso.
7. Una moneda cargada es tal que cara sale el triple de veces que sello. Cuál es la probabilidad
que el quinto sello observado se obtenga en el décimo lanzamiento?
8. Un estudio de investigación se refiere a los efectos secundarios de un nuevo medicamento.

La droga es administrada a los pacientes, uno a la vez, hasta que dos pacientes desarrollen
efectos secundarios. Si la probabilidad de obtener un efecto secundario de la droga es 16 ,
Cuál es la probabilidad que se necesitan ocho pacientes?
9. Una persona está realizando una encuesta telefónica. Si se define “éxito” como el evento que
una persona complete la encuesta y, sea Y la variable aleatoria “cantidad de fallas antes del
tercer éxito. Cuál es la probabilidad de que haya 10 fallas antes del tercer éxito? Suponga
que dos de cada cinco personas contactadas completó la encuesta.
10. Una pirámide regular de cuatro caras, numeradas del uno al cuatro, se lanza repetidas veces.
Se considera “éxito” cuando se obtiene un tres. Cuál es la probabilidad que el décimo éxito
ocurra en el vigésimo quinto lanzamiento?
11. Una persona está realizando una encuesta telefónica. Si se define “éxito” como el evento
que una persona complete la encuesta y, sea Y la variable aleatoria “cantidad de fallas antes
del tercer éxito. Cuántas encuestas fallidas se espera realizar?
12. Recientemente se descubrió que cierta región de la Orinoquía colombiana tiene reservas
potenciales de petróleo. Suponga que una perforación tiene un 20 % de chance de hallar
petróleo. Halle la probabilidad que la quinta perforación llegue a ser la tercera con hallazgo
de petróleo.
13. Considere un mazo de cartas de póquer con 52 cartas. En forma repetida se toma una carta
se observa y anota lo que sale, se devuelve al mazo y se baraja para tomar una nueva carta.
Sea X la variable aleatoria “número de extracciones necesarias para obtener tres reyes”.
a) Determine la fmp de X
b) Cuál es la probabilidad de que X = 36?
14. Existe una probabilidad del 70 % de aprobar una prueba de habilidad psicomotriz para
obtener la licencia de conducción. Cuál es la probabilidad que una persona pase la prueba
en el segundo intento?
15. Algunos camareros en un café están extremadamente distraídos hoy y están mezclando
órdenes de servicio de los clientes llevándoles café descafeinado cuando pidieron café
normal. Supongamos que hay un 60 % de probabilidad de cometer un error en la orden. Cuál
es la probabilidad de obtener el segundo descafeinado en la séptima orden de café normal?
16. Un pediatra desea reclutar a cinco parejas, cada una de las cuales espera su primer hijo,
para participar en un nuevo método de parto natural. La probabilidad que una pareja acepte
participar en el estudio es 0.2. Cuál es la probabilidad de que se les pida a quince parejas
antes de que se encuentren cinco que acepten participar?
17. El x % de los bits transmitidos a través de una transmisión digital se reciben errados, y se
sabe que los bit recibidos errados no superan el 30 %. Los bits se transmiten hasta el segundo
bit errado recibido. Se sabe que la probabilidad de detener la transmisión en el quinto bit
enviado es 0.08192. Determine el porcentaje de bits transmitidos que llegan con error.
18. Se lanza un dado legal hasta que ocurran tres veces la cara con los seis puntos. Sea X la v.a.
que denota “el número de lanzamientos”.
a) Encuentre la función masa de probabilidad de X.
b) Encuentra la media y la desviación estándar de X.
c) Encuentre la probabilidad de que se necesiten al menos 20 lanzamientos.
19. Un cierto tipo de misil tiene una probabilidad de falla de 0.02. Sea N la v.a. “número de
lanzamiento hasta el cuarto lanzamiento con falla”.
a) Encuentre la función masa de probabilidad de N.
b) Encuentra la media y la varianza de N.
c) Encuentre la probabilidad de que haya al menos 4 fallas en los primeros 200 lanza-
mientos.
20. Un examen de señales consta de 20 preguntas tipo test y se conoce de experiencias anteriores
que un alumno tiene probabilidad 0.7 de contestar bien cada pregunta. Hallar:
a) La probabilidad de que la primera pregunta que contesta bien sea la cuarta.
b) Sabiendo que para aprobar el examen es necesario contestar bien a 12 preguntas, ¿cuál
es la probabilidad de que apruebe al contestar la pregunta duodécima?
21. De acuerdo con la revista Chess Life, 40 % de los grandes maestros de ajedrez del mundo
consideran a Garry Kaspárov como el mejor ajedrecista de todos los tiempos. Si se le pregun-
ta varios grandes maestros de ajedrez su opinión a este respecto, encuentre la probabilidad
de que el octavo a quien se le pregunte sea el cuarto que considera a Kaspárov el mejor
ajedrecista del mundo.
22. Según el gerente de la compañía Avianca, 20 % de las personas que hacen reservaciones
por teléfono para un vuelo, finalmente no acudirán a comprar el boleto. Determine la
probabilidad de que séptimo individuo que hace reservación por teléfono, un día cualquiera,
sea el segundo que no se presentará a comprar el boleto.
23. La mayoría de los psiquiatras concuerdan en que aproximadamente 60 % de las personas
que sufren una crisis depresiva mayor se recuperan con ayuda profesional. ¿Cuál es la
probabilidad de que la sexta persona con crisis depresiva mayor, que visita a un psiquiatra,
sea la tercera que se logre recuperar?
4.6 MODELO HIPERGEOMÉTRICO
4.11
Una tienda tiene 20 guitarras en existencia, pero 3 son defectuosas (leves errores en un par de
trastes); las guitarras son del mismo tipo, las diferencia solo el color y algunos adornos de
manera que a los ojos de un comprador solo son distinguibles por el gusto y en consecuencia
cada guitarra es igualmente probable de ser elegida. Alejandro compra 5 guitarras de este lote.
Encuentre la probabilidad de que Alejandro haya comprado 2 guitarras defectuosas.
La población consta de N = 20 elementos igualmente probables de ser seleccionados, la selección

se hace sin reposición (repetición) ya que no tiene sentido que compre una guitarra y la devuelva
al lote para volver a comprarla, en consecuencia en cada selección (ensayo de Bernoulli: buena o
defectuosa) el tamaño de la población va cambiando (las condiciones en la repetición en los ensayos
de Bernoulli no se mantienen) modificando la probabilidad de selección. Veamos formalmente la
selección y la probabilidad solicitada:
I ) Casos totables (número de grupos de 5 guitarras que pueden seleccionarse del lote de 20
guitarras disponibles en la tienda):

20
5
II ) Casos favorables (número de grupos de 5 guitarras que pueden seleccioanrse del lote de 20
guitarras, con 2 son defectuosas y 3 buenas):
X Selección de las 2 guitarras defectuosas:

3
2
X Selección de 3 guitarras sin defectos:

17
3
En consecuencia el número de casos favorables, por el principio de multiplicación, es:

3 17
2 3
III ) Probabilidad de obtener 2 guitarras defectuosas de 5 compradas (seleccionadas de un

lote de 20 guitarras de las cuales hay 3 defectuosas y 17 buenas):
3 17

2 5
20
3 = ≈ 0.1316
5
38
El ejemplo anterior corresponde al modelo hipergeométrico caracterizado por.

X Una muestra de tamaño n tomada de una población finita de tamaño N, la muestra es tomada
sin reposición (repetición). En el ejemplo N = 20 y n = 5.
X La población tiene dos subconjuntos disyuntos bien definidos, uno (el de interés) de tamaño r
con r ≥ n. En el ejemplo el subconjunto de interés son las guitarras defectuosas, r = 3.
X La variable aleatoria de interés X mide el “número de miembros del subconjunto de interés”
en la muestra tomada.
Definición 4.10
Un modelo aleatorio es hipergeométrico si y solo si tienen las siguientes caracteristicas:
I ) Una población finita de tamaño N
II ) La población está particionada en dos clases mutuamente excluyentes C1 y C2 , con
|C1 | = r y C2 | = N − r
III ) Se extrae una muestra aleatoria de tamaño n, n < r, sin reposición de la población.
IV ) Los elementos de la clase C1 se identifican como los éxitos y los de la clase C2 como
los fracasos.
V ) Se pretende medir “el número de éxitos en la muestra de tamaño n”
Definición 4.11
La variable aleatoria X se distribuye hipergeométricamente, en simbolos X ∼ Hg(N, r; n), si y
solo si:
I ) X mide “el número de éxitos en la muestra de tamaño n” seleccionada al azar y sin
repetición de una población finita de tamaño N con r elementos denominados éxitos y
N − r denominados fracasos.
II ) La función masa de probabilidad de X está dada por.
N−r r

n−k k
P(X = k) := N
; k = 0, 1, 2, . . . , n, r ≥ n
n
X Valor esperado: E[X] = nr

N
nr N − r N − n
X Varianza: Var[X] = ×
N N N −1
A continuación referenciamos las funciones más importantes del modelo Hipergeométrico que el
programa R tiene implementadas:
dhyper(x,m,n,k,log=F) Devuelve el valor de la fmp
phyper(q,m,n,k,lower.tail=T,log.p=F) Devuelve el valor de la FD
qhyper(p,m,n,k,lower.tail=T,log.p=F) Devuelve el cuantil q
rhyper(nn,m,n,k) Devuelve vector aleatorio hipergeométrico
Donde:
X x, q: Vector de cuantiles. Corresponde al número de particulares en la muestra.
X m: Selección aleatoria particular.
X n: El número total de la población menos la selección aleatoria particular. n = N − m.
X n: El número de la selección a evaluar.
X prob: Probabilidad.
X nn: Número de observaciones.
X log, log.p: Parámetro booleano, si es TRUE, las probabilidades p son devuelatas como log(p).
X lower.tail: Parámetro booleano, si es TRUE (por defecto), las probabilidades son P[X ≤ x], de
lo contrario son P[X > x].
A continuación una gráfica de una distribución hipergeométrica en la cual se tiene una población de
N = 20 bolas, divididas en m = 8 blancas y n = 12 negras. Se saca una muestra de tamaño k = 4
bolas, en forma aleatoria.
El modelo binomial y el modelo hipergeométrico están relacionados en el sentido que ambos están
sustentados en pruebas Bernoulli, la diferencia es que mientras en el modelo binomial los ensayos
son independientes y la probabilidad de éxito se mantiene estable (constante) en cada repetición, en
el modelo hipergeométrico los ensayos son dependientes y la probabilidad de éxito va cambiando.
Sin embargo, cuando el tamaño de la población, de la cual se muestrea, es grande y el tamaño de la
muestra es pequeño entonces es posible aproximar el modelo hipergeométrico mediante el modelo
binomial. A continuación el teorema que establece esta aproximación.
Teorema 4.3
Aproximación Binomial al modelo hipergeométrico Supongamos que N → ∞, r → ∞, de
r
manera que → ∞, entonces
N
Hg(N, r; n) ←→ Bin(n, p)
es decir
N−r r

n−k k n k
P(X = k) = N
−→ P(X = k) = p (1 − p)n−k
n
k
r
donde p :=
N
4.12
En la fabricación de neumáticos para bicicletas, se sabe que un determinado proceso de

producción produce 10 neumáticos con paredes defectuosas en cada lote de 100 neumáticos
producidos. De un lote de producción de 100 llantas, se selecciona una muestra de 4 para
probar y en caso de que alguna sea defectuosa proceder a su destrucción. Hallar:
a) La probabilidad que la muestra tenga un neumático defectuoso.
b) El número esperado de neumáticos en la muestra de los 4 neumáticos seleccionados.
c) La desviación estándar del número de neumáticos defectuosos en la muestra de tamaño
4.
Consideremos la variable aleatoria X definida como “número de neumáticos defectuosos en la

muestra de tamaño 4 seleccionada aleatoriamente del lote de 100 neumáticos producidos”. En
consecuencia se tiene que X ∼ Hg(N = 100, r = 10; n = 4), y su fmp es:
100−10 10 90
10
4−k 4−k
P(X = k) = 100
k = 100
k
4 4
Luego
90 10

3 1424
a) P(X = 1) = 100
1 = ≈ 0.3.
4
4753
4 × 10
b) E[X] = = 0.4.
100
90 96
c) Var[X] = 0.4 × × ≈ 0.36 por tanto σX = 0.60.
100 99
Ejercicios 4.4
1. Sea X una distribución hipergeométrica con N = 11, r = 6 y n = 7. Calcular
a) P(X = 4)
b) P(X = 5)
c) P(X ≥ 4)
2. Una delegación consiste de 8 hinchas del equipo A y 7 hinchas del equipo B. Se forma un
comité de cinco miembros, seleccionados al azar de entre todas las quince personas que
conforman la delegación. Considere la variable aleatoria “número de miembros del comité
que son hinchas del equipo B”.
a) Halle la fmp de la variable aleatoria.
b) Trace la gráfica de la fmp.
c) Determine la media y la varianza de la variable aleatoria.
3. Cincuenta motocicletas de bajo cilindraje han sido devueltas al distribuidor debido al
a presencia de un ruido oscilante agudo cuando la motocileta está prendida y detenida.
Supongamos que 20 de estas 50 motos tienen discos defectuosos y las otros 30 tienen
problemas menores. Si se examinan al azar 10 de estas 50 motos. Considere la variable
aleatoria “número entre las 10 examinadas que tienen disco defectuoso”.
a) Halle la fmp de esta variable aleatoria.
b) Determine la probabilidad de que se encuentren 6 motos con disco defectuoso de las

10 examinadas.
c) Cuántas motos con disco defectuoso se espera encontrar en esta muestra de 10?
4. En una bolsa negra hay 100 fichas idénticas en todo salvo en su color, distinguidas por roja
y negra. Hay 40 fichas rojas y 60 fichas negras. De las cien fichas se selecciona una muestra
aleatoria de tamaño 30. Si estamos interesados en la cantidad de fichas rojas que aparecen
en esta muestra, entonces:
a) Defina una variable aleatoria que mida el “número de fichas rojas en la muestra de
tamaño 30”.
b) Halle la esperanza y la varianza de esta variable aleatoria.
c) Determine la probabilidad de que en la muestra de tamaño 30 hayan 20 o más fichas
rojas.
5. Un grupo de amigos se reúnen en la casa de Julián para comer un asado. En este grupo
hay 12 mujeres y 8 hombres. De las mujeres 6 estudian ingeniería, 2 economía y el resto
arquitectura; mientras que de los varones dos estudian economia y el resto ingeniería.
a) Si las primeras en llegar a casa de Julián son dos chicas, cuál es la probabilidad de que
estudien la misma carrera?
b) Si tres de estos compañeros se encargan de hacer el asado, cual es la probabilidad de
que estudien lo mismo?
c) Si se seleccionan al azar dos de este conjunto de amigos y se define la variable aleatoria
“número de amigos que estudia economía de esta muestra”, hallar la fmp, la esperanza
y la varianza de esta variable aleatoria.
6. Considere un mazo de poker: 4 palos cada uno con 13 cartas del 1 al 10 más tres figuras J,
Q y K; además 2 jockers o comodines. Es decir en total tiene 54 cartas.
Se seleccionan aleatoriamente, sin reemplazo, cinco cartas del mazo (previamente barajado)
de poker.
a) Cuál es la probabilidad que tres de estas sean figuras (J, Q, K)?
b) Cuál es la probabilidad de obtener un Full?
c) Cuál es la probabilidad de obtener un Poker?
d) Cuál es la probabilidad de obtener un Trio?
e) Cuál es la probabilidad de obtener una Escalera?

7. Se selecciona un jurado de 6 personas de un grupo de 25 personas conformado por 13
mujeres y 12 hombres.
a) Cuál es la probabilidad de que el jurado contenga exactamente 5 mujeres?
b) Cuál es la probabilidad de que el jurado contenga a lo más 2 hombres?
c) Suponga que el jurado de seis personas es seleccionado de un grupo de 2500 personas
de las cuales 1300 son mujeres y 1200 son hombres. Utilice la aproximación binomial
a la distribución hipergeométrica para hallar un valor aproximado dela probabilidad de
que en el jurado hayan exactamente 5 mujeres. Determine el error en la aproximación.
8. Un lote contiene 100 rollos de papel crespón de un proveedor local y 200 unidades de un
proveedor de papel crespón del extranjero. Se seleccionan seis piezas al azar, sin reemplazo.
a) Cuál es la probabilidad de que todos los rollos sean del proveedor local?
b) Cuál es la probabilidad de que por lo menos cuatro rollos de la muestra sean del
proveedor local?
c) Cuál es la probabilidad de que al menos un rollo de papel crespón de la muestra sea
del proveedor local?
9. Un recaudador de impuestos, al verse corto de fondos, decide retrasar el depósito de un
pago de impuesto de una gran propiedad para fondearse financieramente. El dinero fue
reembolsado posteriormente y el monto total depositado en la cuenta correspondiente.
El aviso de este comportamiento fue el retraso del depósito. Durante el período de estas
irregularidades, hubo un total de 470 recaudaciones de impuestos. Una firma de auditoría
realiza una auditoría anual de rutina de estas transacciones; la firma decide muestrear al
azar diecinueve del total de recaudos por impuestos (aproximadamente el 4 %) de los pagos.
Los auditores asumirían un patrón de malversación solo si vieran tres o más irregularidades.
¿Cuál es la probabilidad de que se elijan tres o más de los depósitos diferidos en esta
muestra?
10. De una urna que contiene 6 bolas rojas y 4 bolas negras se extrae una muestra aleatoria de
tamaño 4.
a) Cuál es la probabilidad de obtener 3 bolas rojas?
b) Suponga que el experimento anterior se repite tres veces, reintegrando las bolas
extraídas y agregando el mismo número de bolas extraidas (por ejemplo si en el primer
ensayo se sacan 3 bolas negras y 2 rojas entonces se retornan estas bolas y se añaden
otras 3 bolas negras y otras 2 bolas rojas). Determine la probabilidad de obtener una
secuencia de 1, 2 y 3 bolas rojas en los tres ensayos.
11. Se recibieron 50 facturas en el mes, de las cuales hay 5 que tienen errado el impuesto
facturado. En una auditoria se toma una muestra aleatoria de 10 facturas.
a) Cuál es el número esperado de facturas erradas en esa muestra?
b) Cuál es la probabilidad que en la muestra aparezcan por lo menos 3 facturas erradas.
12. El senado de la república cuenta con 100 miembros de circunscripción nacional y 2 de
circunscripción especial. De este total 75 han tenido investigación por corrupción y 27 no
han tenido ningún tipo de investigación por corrupción. Si se elige al azar una muestra de
diez honorables senadores
a) Cuál es el número esperado de honorables senadores sin investigación por corrupción
en esta muestra aleatoria?

b) Cuál es la probabilidad de que en la muestra todos los seleccionados no tengan
investigación por corrupción?
c) Cuál es la probabilidad de que en la muestra todos los seleccionados tengan investiga-
ción por corrupción?
13. En 500 cálculos, independientes, que un estudiante de ingeniería electrónica hace ha cometi-
do 25 errores. En la evaluación del proyecto su profesor revisa siete calculos aleatoriamente.
Cuál es la probabilidad de que él detecte dos errores?
14. Cierta ciudad tiene a + b potenciales votantes, a están en favor de reducir a dos legisturas a
congresistas y b (con b < a) están en contra. Supongamos que se realiza una votación para
determinar la voluntad de la mayoría con respecto a reducir el periodo como congresista
a máximo dos legislaturas. Si n (con n < b) personas aleatorias de las a + b potenciales
votantes no votaron, cuál es la probabilidad que aquellas que votaron en contra de reducir el
periodo de los congresistas ganen?
15. En una sala de un hospital hay 16 pacientes, cuatro de los cuales tienen algún tipo de cáncer.
Un doctor es asignado a seis de estos pacientes, tomados aleatoriamente de los 16. Cuál es
la probabilidad de que a este doctor le correspondan dos pacientes con algún tipo de cáncer?
16. Se tienen diez cartas de poker colocadas cara-abajo sobre una mesa (los jugadores no
pueden ver las pintas o figuras de las cartas), y dos de estas cartas son ases. Si cinco de estas
cartas se seleccionan aleatoriamente, cuál es la probabilidad de que dos de estas sean ases?
17. De una baraja española de 40 cartas se toma una muestra de cinco cartas sin reemplazamiento.
Obtener la probabilidad de obtener al menos dos aces.
18. Suponga que se emiten 1000 billetes de una lotería y, entre estos billetes 100 pagan el costo
del boleto. Si usted compra diez billetes de esta lotería, determine la probabilidad de que
gane al menos el costo de cinco boletos. ¿Cuál es el número esperado de boletos que hay
que comprar para obtener uno que pague al menos su valor de compra?
19. Existen dos vacantes en el Departamento de Ingeniería Electrónica de cierta prestigiosa
universidad, para asistente de investigación. A un llamado a concurso de estudiantes de
posgrado, se presentan cinco postulantes: tres tienen experiencia en modelos de control y
dos en dispositivos. El comité de posgrado se encarga de elegir tres miembros en forma
aleatoria.
a) ¿Cuál es la probabilidad de que dos tengan experiencia en modelos de control?
b) ¿Cuál es la probabilidad de que a lo más dos tengan experiencia en modelos de control?
c) ¿Cuál es el valor esperado de postulantes, en la muestra, que tienen experiencia en
modelos de control?
20. Tarjetas de circuitos impresos se colocan en prueba de funcionamiento, después de haber sido
dotadas con chips semiconductores. Un lote contiene 100 tarjetas, y 25 son seleccionadas
sin sustitución, para la prueba de funcionamiento.
a) Si 30 tarjetas son defectuosas, ¿cuál es la probabilidad de que al menos una tarjeta
defectuosa aparezca en la muestra?
b) Si 10 tarjetas son defectuosas, ¿cuál es la probabilidad de que al menos una tarjeta
defectuosa aparezca en la muestra?
21. Una empresa de domicilios tiene 15 vehiculos de raparto. suponga que el 40 % de éstos
presenta problemas de frenos. Si se seleccionad cinco vehiculos al azar para hacerles una
prueba tecno-mecánica, ¿cuál es la probabilidad de que dos de los vehiculos probados tenga
problemas de frenos?
22. En una oficina gubernamental de una ciudad laboran cuarenta empleados públicos, de los
cuales quince son corruptos y el resto no. Se eligen ocho empleados de esta oficina para
hacerle una prueba de corrupción, ¿cuál es la probabilidad de que todos sean corruptos?
4.7 MODELO POISSON

El modelo Poisson es, junto con la distribución binomial, una de las más importantes distribución
de probabilidad para variables discretas, es decir, sólo puede tomar los valores 0, 1, 2, 3, 4, . . ..
La distribución de Poisson se emplea para describir varios procesos, entre otros:
• El número de servidores de investigación que se acceden por minuto.
• El número de particulas de un elemento radiactivo que atraviesan por un aparato Geiger.
• El número de automóviles que salen por un peaje en una hora.
• El número de errores tipográficos por página en un libro.
• El número de llamadas que ingresan a un call center.
• El número de mutaciones de determinada cadena de nucleidos después de cierta radiación.
• El número de reclamaciones por mes en un portafolio de pólizas de vehículos de gama alta.
• El número de usuarios que llegan a hacer fila en un centro financiero.
• El número de hormigas por decímetro cuadrado en una plantación de plátano.
• El número de árboles de café contaminados de broca por decámetro cuadrado en una finca de
café.
• El número de bacterias por metro cúbico.
Definición 4.12
Un modelo Poisson es un modelo aleatorio caracterizado por la realización de un ensayo de
Bernoulli, con probabilidad de ocurrancia pequeña manteniéndose estable el promedio de
ocurrencias cuando la repetición de los ensayos se hace grande.
Proposición 4.3
La distribución Poisson es un caso límite de la distribución binomial que ocurren cuando el
número de ensayos Bernoulli, n, se incrementa indefinidamente mientras el producto λ = np,
que corresponde al valor esperado del número de éxitos en las repeticiones del ensayo de
Bernoulli, permanece constante.
Consideremos la variable aleatoria X ∼ Bin(n, p) con función masa de probabilidad

n (
P(X = k) = p 1 − p)n−k
k
De la hipótesis λ = np obtenemos p = λn , por tanto

k
λ n−k

n! λ
P(X = k) = 1−
k!(n − k)! n n
es decir
λ k n(n − 1)(n − 2) . . . (n − k + 1) λ n−k

P(X = k) = 1−
k! nk n
reagrupando términos obtenemos
λ nλk n

n−1 n−k+1 1
P(X = k) = 1 − ×
n k! n n n λ k

1−
n
como:
X
λ n

lı́m 1 − = e−λ
n→∞ n
X
λ k

lı́m 1 − =1
n→∞ n
X
n− j
∀ j = 0, 1, . . . , k − 1 : lı́m = 1,
n→∞ n
entonces al tomar límite en

λ nλk n

n−1 n−k+1 1
P(X = k) = 1 − ×
n k! n n n λ k

1−
n
obtenemos:
e−λ λ k
P(X = k) = , para k = 0, 1, . . .
k!
e−λ λ k
La probabilidad: P(X = k) = se interpreta como la probabilidad de que ocurran k eventos
k!
(éxitos) en un número suficientemente grande de repeticiones de un ensayo de Bernoulli.
Definición 4.13
La variable aleatoria X es de tipo Poisson, en símbolos X ∼ Poi(λ ), si y solamente si su
función masa de probabilidad es
e−λ λ k
P(X = k) = , para k = 0, 1, . . .
k!
X Valor esperado: E[X] = λ

X Varianza: Var[X] = λ
A continuación referenciamos las funciones más importantes del modelo Poisson que el programa R
tiene implementadas:
dpois(x,λ ,log=F) Devuelve el valor de la fmp
ppois(q,λ ,lower.tail=T,log.p=F) Devuelve el valor de la FD
qpois(p,λ ,lower.tail=T,log.p=F) Devuelve el cuantil q
rpois(n,λ ) Devuelve vector aleatorio hipergeométrico
Donde:
X x: Vector de cuantiles.
X q: Vector de cuantiles.
X p: Vector de probabilidades.
X n: El número valores aleatorios a devolver.
X prob: Probabilidad de éxito en cada ensayo.
X λ : Vector de medias (valor no negativo).
X log, log.p: Parámetro booleano, si es TRUE, las probabilidades p son devueltas como log(p).
X lower.tail: Parámetro booleano, si es TRUE (por defecto), las probabilidades son P[X ≤ x], de
lo contrario son P[X > x].
A continuación una gráfica de una distribución Poisson con parámetro λ = 2.

La tasa λ corresponde al número de eventos que ocurren por unidad de tiempo o unidad de espacio
(longitud, área, volumen). Una presentación más general del modelo aleatorio Poisson será dada
posteriormente, sin embargo para propósitos pedagógicos es conveniente tener en cuenta la siguiente
presentación.
Definición 4.14
Un proceso de conteo es un proceso aleatorio {N(t) : t ≥ 0}, donde N(t) representa el
“número total de eventos que ocurren en el intervalo [0,t]”, que satisface los siguientes
axiomas:
I ) N(t) ≥ 0
II ) N(t) es de valor entero
III ) Si s < t entonces N(s) ≤ N(t)
IV ) Para s < t, N(t) − N(s) representa “el número de eventos que han ocurrido en el
intervalo (s,t]
Un proceso de conteo se dice que es de incrementos independientes sí el número de eventos que

ocurren en intervalos disyuntos son independientes, es decir el número de eventos que ocurren
hasta t, es decir N(t), es independiente del número de eventos que ocurre entre t y t + s, es decir
N(t + s) − N(t).
Un proceso de conteo se dice estacionario sí la distribución de probabilidades es la misma en todo
intervalo de igual longitud, es decir el número de eventos que ocurre en el intervalo (s,t] es igual, en
probabilidad, al número de eventos en el intervalo (s + h,t + h] para todo h > 0.
Definición 4.15
El proceso de conteo {N(t) : t ≥ 0} es un proceso de Poisson, con tasa λ > 0 por unidad de
tiempo, si y solamente si {N(t) : t ≥ 0} satisface los siguientes axiomas
I ) N(0) = 0
II ) {N(t) : t ≥ 0} es de incrementos independientes.
III ) {N(t) : t ≥ 0} es de incrementos estacionario, y satisface:
(λt)n
P(N(t + h) − N(h) = n) = P(N(t) = 0) = e−λt , n = 0, 1, 2, . . .
n!
Una consecuencia inmediata de esta definición es:

X E[N(t)] = λt
X Var[N(t)] = λt
4.13
Supongamos que se conoce que los nacimientos en una clínica ocurren aleatoriamente a una
tasa promedio de 1.8 nacimientos por hora. Determinar la probabilidad de que se observen 5
nacimiento en un intervalo de tiempo de 2 horas.
Para un intervalo de dos horas la tasa de nacimiento será de 3.8 nacimientos por 2 horas. De esta
manera consideramos la variable aleatoria N definida como “Número de nacimientos en un periodo
de dos horas”. Asumimos que este proceso de nacimientos es modelado según una distribución
Poisson, es decir
N ∼ Poi(λ = 3.6)
Luego necesitamos calcular P(N = 5):
P(N = 5) = e−0.38 (0.38)5 ≈ 0.13768
4.14
En una clínica el promedio de atención es 20 pacientes por 4 horas, determinar la probabilidad

que en 40 minutos se atiendan menos de 3 personas y que en 180 minutos se atiendan 18
pacientes.
La tasa de atención es de 20 pacientes por intervalos de 4 horas, esto significa que en periodos de 2
horas atenderán 10 pacientes, por tanto la tasa de atención en un periodo de 40 minutos ( 13 de hora)
será de 10
3 pacientes por periodo de 40 minutos.
Asumimos que el proceso de atención es tipo Poisson con tasa λ = 10

3 , entonces definimos la variable
aleatoria N: “número de pacientes atendicos en intervalos de 40 minutos”, luego la fmp de N es:
10 ( 10
3)
n
P(N = n) = e− 3
n!
Entonces la probabilidad de que en un periodo de 40 minutos atiendan menos de 3 pacientes es
P(N < 3) equivalente a P(N ≤ 2), luego
( 10 2 10

10
3)
P(N ≤ 2) = P(N = 2) + P(N = 1) + P(N = 0) = e− 3 + 3 +1 ≈
2! 1!
entonces
[P(N ≤ 2) ≈ 0.35277
4.15
Si para una distribución Poisson con fmp dada por f (k) := P(X = k) se verifica
f (2) + 6 f (0) = 4 f (1)
determinar el valor de la desviación estándar de esta distribución.
λk
Como P(X = k) = e−λ , entonces
k!
λ 2 −λ
f (0) = e−λ , f (1) = λ e−λ , f (2) = e
2
luego la condición f (2) + 6 f (0) = 4 f (1) es equivalente a:
λ 2 −λ
e + 6e−λ = 4λ e−λ
2
cancelando el término común e−λ y multiplicando por 2 obtenemos la ecuación cuadrática en la

incógnita λ y sus soluciones:
√ (
2 8 ± 64 − 48 8 ± 4 6
λ − 8λ + 12 = 0 ⇒ λ = = =
2 2 2
En conclusión los valores posibles de la desviación estándar son
√ √
σX = 2; σX = 6
4.16
En una gran ciudad 5 de cada mil habitantes, en promedio, tienen sangre tipo AB− . Si 200
donantes de sangre, son tomados aleatoriamente. Halle la probabilidad de que por lo menos
10 tengan grupo sanguíneo AB−
Cada donante de sangre es un ensayo Bernoulli: “o bien tiene grupo sanguíneo AB− o bien no lo
tiene” por tanto estamos en presencia de un modelo binomial con parámetro n = 200 y p = 0.005.
Sea X la variable aleatoria “número de donantes con grupo sanguíneo AB− , entonces X ∼ Bin(n =
200, p = 0.005).
Por tanto debemos calcular: P(X ≥ 10) que es equivalente a:
9
200
1 − P(X ≤ 9) = 1 − ∑ (0.005)k (0.995)200−k ≈ 9.2559 × 10−8
k=0 k
Si empleamos el modelo Poisson, como una aproximación al modelo binomial, con λ = 200 ×
0.005 = 1 entonces obtenemos
9
e−1
P(X ≥ 10) = 1 − P(X ≤ 9) = ∑ ≈ 1.11424 × 10−7
k=0 k!
Cuál es el error porcentual que se comete con esta aproximación?
Ejercicios 4.5
1. Una empresa fabricante de automóviles sabe de su proceso de control de calidad que existe
una falla en el sistema de frenos de cierto modelo. La falla puede causar, en raras ocasiones,
un siniestro cuando los autos de este modelo exceden cierta velocidad (alta). De acuerdo
con el estudio de control de calidad se estableció que la distribución del número de carros
por año que experimentarán siniestros (como consecuencia de falla por el mecanismo de
frenos) es Poisson con tasa λ = 5.
a) Determine las unidades de λ .
b) Defina la variable aleatoria relevante.
c) Determine la probabilidad de que a lo más tres carros por año experimenten un siniestro
de este tipo.
d) Determine la probabilidad que por lo menos tres de estos por año experimenten un
siniestro de este tipo.
2. El número de usuarios que llega por hora a cierta unidad de salud sigue una distribución de
Poisson con una media de 7 usuarios por hora.
a) Defina la variable aleatoria de interés y escriba su fmp.
b) Determine la probabilidad que más de 20 usuarios acudan por atención a esta unidad
de saludo en un lapso de 2 horas.
c) Determine el promedio de usuarios que llegará por atención a esta unidad en un
periodo de 90 minutos.
3. Pequeñas aeronaves arriban a un aeropuerto de acuerdo con un proceso de Poisson, a una
tasa de 6 aeronaves por hora.
a) Determine el número medio de pequeñas aeronaves que arriban a este aeropuerto en

un periodo de t horas.
b) Determine la probabilidad de que arriben exactamente 10 aeronaves pequeñas en un
lapso de tiempo de 90 minutos.
c) Determine la probabilidad de que por lo menos 4 aeronaves pequeñas arriben a este
aeripuerto en una hora.
d) Cuál es la probabilidad de que al aeropuerto aariben aeronaves pequeñas en un turno
de 8 horas?
4. Un hipermercado recibe 10 billetes falsos por día.
a) Determine la probabilidad que un día dado el hipermercado reciba entre 15 y 20
billetes falsos.
b) Determine la probabilidad de que el hipermercado reciba a los más 25 billetes falsos
en dos días consecutivos.
5. En la inspección de hojalata producida por un proceso electrolítico continuo, se detectan
0.2 imperfecciones, en promedio, por minuto.
a) Determine la probabilidad de detectar una imperfección en 3 minutos.
b) Determine la probabilidad de detectar cuando menos una imperfección por minuto.
c) Determine el número esperado de imperfecciones en un lapso de 4.5 minutos.
6. El 5 % de los registros contables de una empresa presentan inconsistencias (errores contables
legales). Si el auditor de una investigación contra esta empresa toma 25000 registros conta-
bles determine la probabilidad de que no más de 2500 registros presenten inconsistencias.
7. Si un call center recibe en promedio 15 llamadas por hora, calcular las siguientes probabili-
dades:
a) Que en una hora se reciban diez llamadas.
b) Que en una hora se reciban treinta llamadas.
c) Que en una hora se reciba, al menos, veinte llamadas.
d) Que en una hora se reciban, cuanto mucho 15 llamadas.
8. Suponga que el número de accidentes que suceden en un carretera cada día se distribuye
Poisson con parámetro λ = 3.
a) Determine la probabilidad de ocurran por lo menos tres accidentes en esta carretera
hoy.
b) Determine la probabilidad de ocurran por lo menos tres accidentes en esta carretera
hoy, si se sabe que ya ocurrió un accidente hoy.
c) Cuál es el número esperado de accidentes para una semana completa?
9. Suponga que existen 5 carreteras que salen y llegan a una ciudad. El número de accidentes
diario que ocurren en estas carreteras se distribuyen Poisson con parámetros 0.02, 0.05, 0.07,
0.08 y 0.10, respectivamente. Encontrar el número esperado de accidentes en cualquiera de
estas carreteras.
10. Compare la aproximación Poisson con la correcta probabilidad binomial para los siguientes
casos:
a) P(X = 2); cuando n = 8 y p = 0.10
b) P(X = 0); cuando n = 10 y p = 0.10
c) P(X = 4); cuando n = 9 y p = 0.2
d) P(X = 9); cuando n = 10 y p = 0.95

11. Se sabe que una fuente radiactiva emite partículas alfa a un ritmo de 1.5 por minuto. Si
medimos el número de partículas alfa emitidas en dos minutos
a) Cuál es el resultado promedio esperado?
b) Cuál es la probabilidad de observar 0, 1, 2, 3, 4 partículas alfa?
c) Cuál es la probabilidad de observar por lo menos cinco partículas alfa?
12. En promedio, cuatro accidentes de tráfico por día, ocurren en la vía NQS. Cuál es la
probabilidad que en cualquier día dado
a) ocurran exactamente cuatro accidentes en esa vía?
b) no más de diez accidentes ocurran en esa vía?
c) al menos ocho accidentes ocurran en esa vía?
13. El número promedio de roedores por decámetro cuadrado es estimado en diez. Halle la
probabilidad de que:
a) menos de ciento veinte roedores sean encontrados en una hectárea. a
b) más de cincuenta roedores sean hallados en media hectárea.
14. Considere un experimento que consiste en contar el número de partículas α emitido en
un intervalo de 1 segundo por 1 gramo de material radiactivo. Si se sabe, por experiencia
pasada, que 3.2 de tales partículas α son emitidas, cuál es una buena aproximación a la
probabilidad que no más de dos partículas α sean emitidas?
15. Suponga que el número promedio de reclamaciones que llegan diariamente a la oficina de
siniestros y reclamaciones de una compañía de seguros, es 5.
a) Determine la probabilidad de que ocurran 4 relamaciones en exactamente tres de los
siguientes cinco días (asumiendo que el número de reclamaciones en diferentes días
es independiente).
b) Qué proporción de dias tendrá menos de cinco reclamaciones?
16. Se sabe que el número de smartphones defectuosos producidos diariamente en cierta fabrica
se distribuye Poisson con media 4 smartphones por día. En un periodo de dos días, ¿cuál es
la probabilidad que el número de smartphones defectuosos exceda las cinco unidades?
17. Suponga que el número de errores en una pieza de software tiene una distribución Poisson
con una tasa de 3 errores por pieza. Determine la probabilidad de que en una pieza de
software hayan por lo menos cuatro errores.
18. Sea X ∼ Pois(λ ) con función masa de probabilidad f (x), es decir f (x) = P(X = x). Se sabe
que
2 f (0) + f (2) = 2 f (1)
Halle la varianza de X.
19. Los cambios en los procedimientos de planificación de aeropuertos requieren considera-
bles planificaciones. Las tasas de llegada de las aeronaves son factores importantes que
deben tenerse en cuenta. Supongamos que las aeronaves pequeñas llegan a un aeropuerto
determinado, de acuerdo con un proceso de Poisson, a razón de seis aviones por hora.
a) ¿Cuál es la probabilidad de que exactamente cuatro aviones pequeños lleguen durante
un período de una hora?
b) ¿Cuál es la probabilidad de que a lo más lleguen cuatro aviones pequeños durante un

período de una hora?
c) Si definimos una jornada de trabajo de doce horas, ¿cuál es la probabilidad de que al
menos 75 aviones pequeños llegan en un día?
20. El número de clientes que llegan por hora en una unidad de urgencias médica se supone que
siguen una distribución de Poisson con una media de doce clientes por hora.
a) Calcular la probabilidad de que más de veinte pacientes lleguen en un periodo de dos
horas.
b) ¿Cuál es el número promedio de llegadas durante un periodo de diez minutos?
21. Las ventas de kit de cámaras de vigilancia siguen una distribución poisson con una media
de doce kit vendidas por semana (lunes a sábado). Determinar
a) la probabilidad de que ningún kit de cámaras de seguridad se venda una semana
específica.
b) la probabilidad de que por lo menos cuatro kit de cámaras de seguridad se vendan en
un día.
c) la probabilidad de que a lo más se vendan veinticuatro kit de cámaras de seguridad en
el mes de febrero.
22. Suponga que el número de paquetes extraviados por la compañía Aeroenvios en un día es
una distribución poisson con un promedio de cuatro paquetes extraviados por día. Determine
la probabilidad de que, en un día cualquiera
a) Se pierdan tres paquetes.
b) Se extravíen cuatro o cinco paquetes.
c) Treinta paquetes se extravíen en una semana.
a Una hectárea = 10000 m2
Modelo uniforme
Modelo exponencial
Modelo gamma
Función Gamma
Distribución Gamma
Modelo Weibull
Modelo Beta
Modelo normal
5 — Modelos continuos
En este capitulo abordaremos algunos modelos de probabilidad para variables aleatorias continuas.
5.1 Modelo uniforme

Definición 5.1
La variable aleatoria X se distribuye uniformemente en el intervalo [a, b], a < b, si y solamente
su función de densidad es (
1
si a ≤ x ≤ b
f (x) = b−a
0 en otro caso
La Función de Distribución, FD, de X es:



0, si x < a
x−a
FX (x) := , si a ≤ x < b

 b−a
1, si x ≥ b

106 Modelos continuos
X Esperanza matemática
a+b
E[X] = µX =
2
X Varianza
(b − a)2
Var(X) = σX2 =
12
X Función generadora de Momentos

rb ra
 e − e , para r 6= 0

MX (r) := E(erX ) = r(b − a)
para r = 0

1,
X Función tasa de riesgo

fX (x) 1
λ (x) = = , para a ≤ x < b
1 − FX (x) b − x
5.1
Sea Y una variable aleatoria uniformemente distribuida en el intervalo (0, 5), calcular la
probabilidad que las raices de la ecuación cuadrática 4x2 + 4xY + Y + 2 = 0 sean números
complejos.
La función de densidad de probabilidad de Y es

(
1
0<y<5
fY (y) = 5
0 otros casos
Calculamos la probabilidad P((4Y )2 − 16(Y + 2) < 0), es decir P(16Y 2 − 16Y − 32 < 0)
2
P(Y 2 −Y − 2 < 0) ⇒ P((Y − 2)(Y + 1) < 0) ⇒ P(−1 < Y < 2) = P(0 < Y < 2) =
5
5.1 Modelo uniforme 107
5.2
El espesor de una hoja en un componente de un thermoescan se distribuye uniformemente

entre 0.9 y 1.10 milímetros.
a) Determine la proporción de hojas que exceden 1.0 mm.
b) Qué medida de espesor es excedida por el 30 % de las hojas?
Sea X la variable aleatoria “espesor de una hoja para un thermoescan”, entonces X ∼
U(0.9, 1.10), por tanto su fdp es:
(
5 0.9 ≤ x ≤ 1.1
f (x) =
0 otro caso
luego
0.1
a) P(X > 1) = 0.2 = 12 , es decir el 50 %.
1.1−x
b) Hallar x tal que P(X > x) = 0.2 entonces 0.2 = 0.2 entonces x = 1.06 mm, o bien
Z 1.1 1.1

5dy = 5y = 0.2 ⇒ 1.1 − x = 0.25 ⇒ x = 1.06 mm
x x
Ejercicios 5.1
1. Sea X una variable uniforme en el intervalo [0, 10]. Calcular

1
P X+ ≥7
X
2. Sea X una variable aleatoria con fdp
e−x
fX (x) = , para − ∞ < x < ∞
(1 + e−x )2
Determinar la fdp de la variable aleatoria

1
Y=
1 + e−X
3. Se construye una caja de alto 10 pulgadas y de base cuadrada de lado X, siendo X ∼ U(2, 8).
Determinar el volumen esperado de la caja.
4. Se seleccionan dos números, en forma aleatoria, del intervalo (0, 1). Determinar la probabi-
lidad que los dos numeros seleccionados difieran en más de 12 .
5. Hallar la probabilidad de que la ecuación cuadrática
x2 + 2θ x + 1 = 0
tenga por lo menos una solución real, si el coeficiente θ es un número real que se elige al
azar de manera uniforme del intervalo (−4, 4)
6. Un emisor de electrones produce haces de electrones con variación aleatoria de energía

cinética que se distribuye de manera uniforme entre tres y siete julios. Suponga que es
posible ajustar el límite superior de la energía cinética (fijado actualmente a siete julios).
a) Cuál es la energía cinética media?
b) Cuál es la variación de la energía cinética?
c) Cuál es la probabilidad de que un haz de electrones tenga energía cinética de exacta-
mente 3.2 julios?
d) Cuál debería ser el límite superior de modo que la energía cinética media se aumente a
ocho julios?
e) Cuál debería ser el límite superior de manera que la varianza de la energía cinética
disminuya a 0.75 julios?
7. Se cree que el tiempo X, medido en minutos, para que un ayudante de laboratorio prepare el
equipo para un experimento se distribuye uniformemente entre 20 minutos y media hora.
a) Cuál es la probabilidad de que el tiempo de preparación exceda los 27.5 minutos?
b) Cuál es la probabilidad de que el tiempo de preparación se encuentre a 2.5 minutos
del tiempo medio de preparación?
c) Cuál es la probabilidad de que el tiempo de preparación exceda los 25 minutos si ya
transcurrieron 22 minutos en la preparación?
d) Dado a, de modo que 20 < a < a + 2 < 30, cuál es la probabilidad de que el tiempo
de preparación este entre a y a + 2?
8. un número real t se elige aleatoria y uniformemente del intervalo (0, 1). Determinar la
probabilidad de que ln( 1r ) < 3
9. Sea α > 0 un número real, X ∼ U(−α, α). Si P(X > 1) = 31 , determine el valor de α y
halle P(X 2 > 1)
10. Para ir de su casa al trabajo un individuo tiene que tomar un autobús y a continuación otro.
En cada paradero el individuo espera entre 0 y 10 minutos, distribuidos uniformemente.
Estudie el tiempo de espera total en los dos paraderos.
11. La magnitud de la fuerza de interacción entre dos cargas puntuales, es inversamente pro-
porcional al cuadrado de la distancia. Suponga que la distancia entre dos cargas puntuales
es aleatoria y distribuida uniformemente entre 2 y 5 micras. Estudie el comportamiento
aleatorio, desde una perspectiva netamente probabilista, de la magnitud de la fuerza de
interacción, que magnitud de la fuerza de interacción se espera?
12. Si X es una variable aleatoria uniforme en el intervalo (−L, L), con L > 0. Hallar el valor
de L tal que P(|X| < 1) = P(|X| > 1)
13. Si X ∼ U(−4, 8) hallar P(X 2 > 9)
14. El minutero del reloj de una Catedral se mueve a saltos al final de cada minuto. Hallar la
probabilidad de que, en un instante dado, el reloj señale un tiempo que difiera del tiempo
real en no más de veinte segundos.
15. La variable aleatoria X se distribuye uniforme, tiene media 5.5 y varianza 12, determine la
probabilidad de que X se encuentre por lo menos a un cuarto de la distancia del extremo
superior del intervalo si se sabe que e mayor que el punto medio del intervalo.
16. Una máquina produce cubos de poliuretano para uso industrial. La arista de cualquiera de
estos cubos varia aleatoriamente uniforme entre los valores 1.2 pulgadas y 2.5 pulgadas. Si
Y es la variable aleatoria que representa el volumen de cualquiera de estos cubos, determinar

el volumen promedio y la desviación estándar de este volumen.
17. La ruta B23 de un sistema de transporte masivo llegan a la hora prefijada en una estación, con
un retraso aleatorio X que varia uniformemente entre 3 y 8 minutos. Hallar la probabilidad
de que esta ruta llegue a esa estación con un retraso de por lo menos cuatro minutos pero no
más de cinco minutos.
18. En ciertos experimentos, cuando se determina la masa específica se comete un error aleatorio
uniforme entre −0.0015 y 0.015. Determine la probabilidad de que el error
a) esté entre −0.002 y 0.003
b) exceda la cantidad 0.005 en valor absoluto.
19. La variable aleatoria X se distribuye uniformemente en el intervalo [−4, 4], Sea µ = E(X) y
σ 2 = Var(X). Determinar
a) P(|X − 2| > 3.5)
b) P(|X − µ| ≤ 1.5)
c) P(|X − µ| < √σ3 )
20. Se elige al azar un número real en el intervalo (0, 1) y se escribe en notación decimal.
Determinar la probabilidad que
a) su primer digito después del punto decimal sea 1
b) Su segundo digito después del punto decimal sea 5
21. Hallar la probabilidad de que la ecuación cuadrática
x2 + θ x + 1 = 0
tenga por lo menos una solución real, si el coeficiente θ es un número real que se elige al
azar de manera uniforme del intervalo (−3, 4]
22. Sea α > 0 un número real, X ∼ U(−α, α). Si P(X < 12 ) = 10 7
, determine el valor de α y
1 7
halle P(|X + 5 | < 10 )
5.2 Modelo exponencial
X se distribuye exponencialmemente, con parámetro β > 0, si y solamente si su función de densidad

de probabilidad, fdp, es:
(
β e−β x , si x > 0
fX (x) :=
0, otro caso
La Función de Distribución, FD, de X es:

(
0, si x ≤ 0
FX (x) := −β x
1 − e , si x > 0
X Función de sobrevivencia:
(
e−β x si x > 0
SX (x) := P(X > x) = 1 − FX (x) = 1 − (1 − e−β x ) =
0 otro caso
1
E[X] = µX =
β
X Varianza
1
Var(X) = σX2 =
β2
β
MX (r) := E(erX ) = , para 0 ≤ r < β
β −r
X Función tasa de riesgo

fX (x)
λ (x) = = β , para x > 0
1 − FX (x)
En efecto
Z ∞
MX (r) = erx β e−β x dx
0
Z ∞
=β e−(β −r)x dx
0
−(β −r)x ∞
e
=β − suponiendo β − r > 0
β − r 0
β
=
β −r
Además
β 2β 1 2
MX0 (r) = , M 00 (r) = =⇒ M 0 (0) = E(X) = , MX00 (0) = E(X 2 ) = 2
(β − r)2 X (β − r)3 β β
por tanto
2 1 1
Var(X) = E(X 2 ) − (E(X))2 = 2
− 2= 2
β β β
Proposición 5.1
Si X ∼ exp(β ) entonces X no tiene memoria.
En efecto
P(X > s + t; X > s)
P(X > s + t|X > s) =
P(X > s)
P(X > s + t)
=
P(X > s)
e−β (s+t)
=
e−β s
−βt
=e
= P(X > t)
Proposición 5.2
Sea X una variable aleatoria continua no negativa tal que P(X > s + t) = P(X > s)P(X > t),
para todo s,t > 0, entonces X es un modelo exponencial.
Denotemos con S la función de sobrevivencia de X, es decir S(x) = P(X > x); recordemos que S
satisface:
I) Es monótona no creciente, es decir si a < b entonces S(a) ≥ S(b).

II ) De acuerdo con la condición de sin memoria, S(s + t) = S(s)S(t), para todo s,t ≥ 0.
III ) S(0) = P(X > 0) = 1
Ahora bien, observemos que:
X Tomando, sucesivas veces, s = t en la condición II) obtenemos
S(2t) = (S(t))2 , S(3t) = (S(t))3 , S(4t) = (S(t))4 , . . . , S(mt) = (S(t))m , ∀m ∈ Z+
X Similarmente

t 1 t 1 t 1 t 1
S = (S(t)) 2 , S = (S(t)) 3 , S = (S(t)) 4 , . . . , S = (S(t)) n , ∀n ∈ Z+
2 3 4 n
X Combinando los dos resultados anteriores tenemos
mn
m
S t = S(t) , ∀m, n ∈ Z+
n
X De la densidad de Q sobre R, todo número real es el limite de una sucesión de números
racionales, entonces de la continuidad de S tenemos que
∀x ∈ R+ : S(xt) = (S(t))x
Tomando t = 1 obtenemos:
S(x) = (S(1))x = ex ln(S(1))
y como 0 < S(1) ≤ 1 entonces ln(S(1)) < 0, definiendo −β := ln(S(1)) obtenemos
S(x) = e−β x
es decir que la variable aleatoria X corresponde a un modelo exponencial.
Ejercicios 5.2
1. El tiempo de falla (en horas) de ventiladores para computadores fijos se modela mediante
una distribución exponencial con tiempo medio de duración 3333, 3.
a) Qué proporción de ventiladores durarará al menos 10000 horas?
b) Qué proporción de ventiladores durará por mucho 7000 horas?
2. El tiempo entre la llegada de dos mensajes electrónicos a su computador personal es
exponencialmente distribuido con una media de 2 horas.
a) Cuál es la probabilidad que usted no reciba un mensaje electrónico en su PC durante
un periodo de 2 horas?
b) Si usted no ha recibido ningún mensaje electrónico en su PC en las últimas 3 horas,
cuál es la probabilidad de que no le llegue ningún mensaje en las siguientes 2 horas?
c) Cuál es el tiempo de espera entre su quinto mensaje elecrónico y su sexto mensaje
electrónico?
3. El tiempo entre llegadas de taxis a un centro comercial es exponencialmente distribuido con
un tiempo medio de 10 minutos.
a) Cuál es la probabilidad que usted tenga que esperar por un taxi por lo menos una hora?
b) Si usted ha estado esperando por una hora, por un taxi, cuál es la probabilidad llegue
un taxi en los siguientes diez minutos?

c) Determine el tiempo t tal que la probabilidad que usted espere por un taxi más de t
minutos es 0.1?
d) Determine el tiempo t tal que la probabilidad que usted espere por un taxi menos de t
minutos es 0.9?
e) Determine el tiempo t tal que la probabilidad que usted espere por un taxi menos de t
minutos es 0.5?
4. Sea X una variable aleatoria exponencial con media λ .
a) Determine las siguientes probabilidades:
P(X > λ ); P(X > 2λ ); P(X > 3λ ); P(X > 4λ ); . . . P(X > mλ )
para m ∈ Z+ .
b) Cómo las probabilidades del numeral anterior dependen de λ ?
c) Si el valor mediano de esta variable aleatoria es 21 , cuál es el valor de λ ?
d) Si P(4 < X ≤ 8) = e−1e2
, cuál es el valor de λ ?
5. Sean X y Y variables aleatorias independientes estadisticamente, con media β1 y β2 respec-
tivamente.
a) Determinar la función de densidad de probabilidad de la variable aleatoria Z :=
min{X,Y }
b) Determinar la función de densidad de probabilidad de la variable aleatoria Z :=
Max{X,Y }
c) Determinar la función de densidad de probabilidad de la variable aleatoria Z := X +Y
d) Determinar la función de densidad de probabilidad de la variable aleatoria Z :=
(1 − θ )X + θY , para 0 ≤ θ ≤ 1
6. El tiempo de falla en meses, X, de tubos de luz alógena producidos en dos plantas industriales
A y B obedecen, respectivamente, a las siguientes funciones distribución:
FX (x) = (1 − e−0.2x )H(x)
FX (x) = (1 − e−0.5x )H(x)

donde
(
1, si x ≥ 0
H(x) :=
0, si x < 0
La producción de la planta B triplica la de la planta A. Los tubos, indistinguibles al ojo del

ser humano, se entremezclan antes de distribuirlos para la venta.
a) Cuál es la probabilidad que un tubo comprado dure al menos 2 meses?
b) Cuál es la probabilidad que un tubo comprado dure al menos 5 meses?
c) Cuál es la probabilidad que un tubo comprado dure al menos 2 meses, si ha funcionado
durante tres meses?
7. La variable aleatoria T mide el tiempo, en minutos, entre dos llamadas consecutivas que
llegan a la oficina PQR de una EPS. La fdp de T es
(
1 −0.1t
e , t >0
fT (t) = 10
0, en otro caso
a) Cuál es el tiempo promedio entre llamadas consecutivas?

b) Cuál es la varianza entre llamadas consecutivas?
c) Cuál es la probabilidad que el tiempo entre llamadas consecutivas supere al tiempo
promedio entre llamadas consecutivas?
d) Cuál es la probabilidad que el tiempo entre llamadas consecutivas supere al tiempo
mediano entre llamadas consecutivas?
e) Si se recibió una llamada a las 2 : 00 p.m., cuál es la probabilidad de que la siguiente
llamada ingrese antes de las 2 : 18 p.m.?
8. En un banco se tienen dos cajeros cuyo tiempo de atención, por cliente, se modela expo-
nencial con un promedio de 8 minutos por cliente. Los tiempos de atención de los dos
cajeros son independientes. Suponga que dos clientes A y B, apenas abren el banco, pasan a
estos cajeros (uno para cada cajero). Determine la probabilidad de que el cliente A salga de
atención primero que el cliente B.
9. El tiempo de vida útil de una lámpara eléctrica es de mil horas. Hallar
a) La probabilidad de que una de estas lámparas deje de funcionar antes de los ochocientas
horas.
b) La probabilidad de que una de estas lámparas funcione no más de 400 horas si ha
estado funcionando por ochocientas horas.
c) Un lote de cincuenta de estas lámparas se envían a un comprador, y se le da una
garantía de reposición del lote completo si cinco de estas lámparas dejan de funcionar
antes de su vida media. Determine la probabilidad de que se haga efectiva la garantía.
5.3 Modelo gamma

El modelo aleatorio gamma es un modelo continuo de múltiples aplicaciones: en redes de almacena-
miento, lineas de espera, hidrología, finanzas, modelos de transporte. En esta sección presentaremos
el modelo con alguna de sus características.
5.3.1 Función Gamma
Definición 5.2
Sea α > 0 un número real. La función gamma de argumento α se define por la integral
impropia
Z ∞
Γ(α) := t α−1 e−t dt
0
Veamos que la función está bien definida, es decir demostremos que la integral es convergente.
5.3 Modelo gamma 115
Proposición 5.3
La integral
Z ∞
t α−1 e−t dt
0
converge para todo α > 0
Observemos que
Z ∞ Z 1 Z ∞
α−1 −t α−1 −t
t e dt = t e dt + t α−1 e−t dt
0 0 1
siempre y cuando las integrales de la descomposición existan.

I) Consideramos la integral
Z 1
t α−1 e−t dt
0
Como 0 ≤ t ≤ 1 entonces −1 ≤ −t ≤ 0, luego e−t ≤ 1, por tanto
tα
Z Z
α−1 −t
t e dt ≤ t α−1 dt =
α
Consideremos dos casos, respecto de α:
a) Caso 1: α ≥ 1, entonces
t α 1 1
Z 1
α−1 −t
t e dt ≤ = < +∞
0 α 0 α
b) Caso 2: 0 < α < 1, entonces α − 1 < 0 y por tanto la función h(t) = t α−1 tiene una
discontinuidad en el intervalo [0, 1], entonces
t α 1
Z 1 Z 1
α−1 α−1 1 aα 1
t dt = lı́m+ t dt = lı́m+ = lı́m+ − = < +∞
0 a→0 a a→0 α a a→0 α α α
II) Consideremos la integral

Z ∞
t α−1 e−t dt
1
Observemos los hechos siguientes:

X Para todo n ∈ Z+ :
t n−1
lı́m t =0
t→∞ e2
n−1
t
por tanto, para todo ε > 0, existe M ∈ R+
tal que para todo t > M se cumple t < ε
e2
Ejercicio: demostrar que esta integral es absolutamente convergente.
Proposición 5.4
La función Gamma tiene las siguientes propiedades:
a) Γ(α + 1) = αΓ(α)
+1) = n!, para todo n ∈ N
b) Γ(n
1 √
c) Γ = π
2
5.3.2 Distribución Gamma

X se distribuye gamma, con parámetros positivos α y β si y solamente si su función de densidad
de probabilidad, fdp, es:

α−1 β α e−β x
x

, si x > 0
fX (x) := Γ(α)

0, otro caso
α
E[X] = µX =
β
X Varianza
α
Var(X) = σX2 =
β2
α
rX β
MX (r) := E(e ) = , para 0 ≤ r < β
β −r
Ejercicios 5.3
1. Llamadas llegan a un call center siguiendo una distribución de Poisson con una media de 5
llamadas por minuto.
a) Determine el modelo aleatorio (distribución) que mide el tiempo hasta la décima
llamada.
b) Halle el tiempo medio hasta la décima llamada.
c) Determine el tiempo medio entre la novena y la décima llamada.
d) Cuál es la probabilidad que exactamente cuatro llamadas ocurran dentro de un minuto?
2. El tiempo entre fallas de un láser de una máquina de citogenética es exponencialmente
distribuida con una media de 25 mil horas.
a) Cuál es el tiempo esperado hasta la segunda falla?
b) Cuál es la probabilidad que el tiempo hasta la tercera falla exceda las 50000 horas?
3. Errores causados por contaminación en discos ópticos ocurren a una tasa de un error cada
105 bits. Asuma que los errores siguen una distribución de Poisson.
a) Cuál es el número medio de bits hasta que cinco errores ocurren.
b) Cuál es la desviación estándar del número de bits hasta que cinco errores ocurren?
5.4 Modelo Weibull 117
c) El código corrección-errores podría ser inefectivo si existen tres o más errores en los
105 bits. Cuál es la probabilidad de este evento?
4. Dada la variable aleatoria X gamma con valor esperado 8 y varianza 32. Determinar la
probabilidad que X asuma un valor mayor que su moda pero menor que su media.
5. Un individuo empezó a pescar en la orilla de un lago, a las 9 de la mañana. Si el tiempo
que tarda en atrapar un pez se distribuye exponencialmente con media de 3 (en horas).
Determinar las siguientes probabilidades:
a) Atrape el cuarto pez antes de las 10 de la mañana.
b) Atrape el quinto pez entre las 9 : 40 a.m. y las 10 : 20 a.m.
c) Atrape su primer pez antes de las 10 de la mañana, dado que hasta las 9 : 40 a.m. no
había logrado atrapar ninguno.
6. En un cade para pago de servicios, el tiempo que tarda la cajera en atender a un individuo
se distribuye exponencial con parámetro β = 10 (horas). Si hay once personas delante de
usted, en la fila, y son las 9 : 39 a.m., determine la probabilidad de que pague su recibo antes
de las 10 : 15 a.m.
7. En un peaje los automóviles llegan a un ritmo promedio de 2.4 autos por minuto. Cada
automóvil paga $12, 000. Determine la probabilidad de que, a partir de un momento dado,
el encargado del cobro e peaje logre captar $192, 000 en menos de cinco minutos.
8. En una ciudad se observa que el consumo diario de energía (en millones de kilowatt-hora)
es una variable aleatoria que sigue una distribución gamma con parámetros α = 3 y β = 13 .
Si la planta de energía que suministra a la ciudad tiene una capacidad diaria de generar un
máximo de 12 millones de kilowatt-hora, ¿cuál es la probabilidad de que haya un día donde
no se pueda satisfacer la demanda?
9. Se sabe que el tiempo de sobrevivencia, en días, de armadillos expuestas a glifosato es una
variable aleatoria que sigue una distribución gamma con parámetros α = 4 y β = 0.10,
¿cuál es la probabilidad de que un armadillo no supere los sesenta días de vida después de
contaminarse con este tóxico?
10. Diana entra a un banco que tiene n cajeros. Todos los cajeros están ocupados dando servicio
a clientes, y existe una única fila que abastece de usuarios a los cajeros, con un cliente por
delante de Diana. Si el tiempo de servicio de un cliente es exponencial con parámetro λ ,
halle la distribución para el tiempo de espera para Diana en la fila.
5.4 Modelo Weibull
Definición 5.3
La variable aleatoria X se distribuye Weibull si y solamente si su función de densidad de
probabilidad es
(
αβ xα−1 e−β x X ≥ 0
α
f (x) =
0 x<0
N
X Si X se distribuye weibull con parámetros α (de forma) y β (de escala), entonces

escribiremos X ∼ W (α, β )
X Si α = 1 entonces el modelo Weibull se transforma en un modelo exponencial con
parámetro β
Proposición 5.5
Si X ∼ W (α, β ) entonces la función de distribución, acumulativa, es
F(x) = 1 − e−β x , para x ≥ 0

α
Las funciones de distribución de las distribuciones de Weibull de las ilustraciones son:

3
2
F(x) = 1 − e−2.5x ; F(x) = 1 − e−10x 2
5.3
Si X ∼ W (2; 2.5), representa el tiempo de vida en años de una parte de una maquina. Hallar la
probabilidad que la parte falle durante los primeros seis meses, y la probabilidad que la parte
dure por lo menos un año.
2
X P(X ≤ 0.5) = F(0.5) = 1 − e−2.5(0.5) ≈ 0.465
2
X P(X > 1) = 1 − F(1) = e−2.5(1 ) ≈ 0.082
Proposición 5.6
Si X ∼ W (α, β ) entonces
Γ(1 + α1 )

1 2 2 1
E(X) = 1 ; V (X) = 2 Γ(1 + ) − Γ (1 + )
βα βα α α
5.5 Modelo Beta 119
5.5 Modelo Beta
Definición 5.4
Sean a > 0 y b > 0. La función beta se define por
Z 1
B(a, b) := xa−1 (1 − x)b−1 dx
0
Proposición 5.7
Para a > 0 y b > 0
Γ(a)Γ(b)
B(a, b) =
Γ(a + b)
Definición 5.5
La variable aleatoria X se distribuye Beta con parámetros a, b, si y solo si su función de
densidad es
 1 xa−1 (1 − x)b−1 0 < x < 1


f (x) = B(a, b)
0 otro caso

Proposición 5.8
Si X ∼ B(a, b) entonces
a ab
E(X) = ; Var(X) =
a+b (a + b + 1)(a + b)2
5.6 Modelo normal
Definición 5.6
La variable aleatoria X se distribuye normal, con media µ y varianza σ 2 , si y solamente si su
función de densidad de probabilidad es
2
1 − (x−µ)
f (x) = √ e 2σ 2
2πσ
El modelo normal también es conocido como modelo gaussiano.
Proposición 5.9
Si X ∼ N(µ, σ 2 ), entonces
1 2 2
a) MX (t) = eµt+ 2 σ t t
b) E(X) = µ
c) Var(X) = σ 2
En efecto
2
1
Z ∞
− (x−µ)
MX (t) = √ e 2σ 2 etx dx
−∞ 2πσ
2 2
1
Z ∞
− x −2µx+µ
=√ e 2σ 2 etx dx
2πσ −∞
2 2 2
1
Z ∞
− x −2µx+µ2 −2σ tx
=√ e 2σ dx
2πσ −∞
2 2 2 2 2
1
Z ∞
− [(x−µ)−σ t] +µ2 −(µ+σ t)
=√ e 2σ dx
2πσ −∞
2 2 2 t−σ 4 t 2
1
Z ∞
− [(x−µ)−σ t] −2µσ
=√ e 2σ 2 dx
2πσ −∞
2 t]2 2µσ 2 t+σ 4 t 2
1
Z ∞
− [(x−µ)−σ
= √ e 2σ 2 e 2σ 2 dx
2πσ −∞
2 t]2
1
Z ∞
σ 2t2 − [(x−µ)−σ
= eµt+ 2 √ e 2σ 2 dx
−∞ 2πσ
2
1
Z ∞
σ 2t2 − (x−µ)]
= eµt+ 2 √ e 2σ 2 dx
−∞ 2πσ
1 2t 2
= eµt+ 2 σ
De la función generadora de momentos para X, es claro que

1 2t 2 1 2t 2 1 2t 2
MX0 (t) = eµt+ 2 σ · (µ + σ 2t); MX00 (t) = eµt+ 2 σ · (µ + σ 2t)2 + eµt+ 2 σ ·σ2
por tanto
E(X) = lı́m MX0 (t) = µ; E(X 2 ) = lı́m MX00 (t) = µ 2 +σ 2 ⇒ Var(X) = E(X 2 )−(E(X))2 = µ +σ 2 − µ 2 = σ 2
t→0 t→0
Definición 5.7
Sea X una variable aleatoria con media µ, finita, y varianza σ 2 . La estandarización de X es
X −µ
la variable aleatoria X ∗ := . Esta variable aleatoria cumple E(X ∗ ) = 0, Var(X ∗ ) = 1
σ
y X = σ X ∗ + µ; es decir X ∗ es exactamente X medida en diferentes unidades, llamadas
unidades estándar.
Definición 5.8
Dada X ∼ N(µ, σ 2 ), la estandarización de X se denota por Z y se le llama distribución
normal estándar. La función de densidad de probabilidad de Z está dada por
1 z2
f (z) = √ e− 2
2π
La función de distribución, acumulativa, de Z se simboliza por Φ, y está dada por
Z z
1 x2
Φ(z) = √ e− 2 dx
2π −∞
Usualmente, el manejo de la distribución normal estándar se hacia mediante tabla de sus valores.
Sin embargo, es posible emplear software estadístico para hallar sus valores. En general se tienen las
siguientes aproximaciones:
Proposición 5.10
Si Z ∼ N(0, 1) entonces
Z ∞
z2 √
e− 2 dz = 2π
−∞
Una función relacionada con la función de distribución Φ es la función error, denotada erf y definida
por
Z x
2 2
er f (x) := √ e−z dz, x ≥ 0
π 0
y se encuentra relacionada con Φ mediante

1 1 z √
Φ(z) = + er f ( √ ); o bien er f (z) = 2Φ( 2z) − 1
2 2 2
Definición 5.9
Sea X una variable aleatoria con FD, F, y consideremos un número real p tal que 0 < p < 1.
Un cuartil de orden p de la variable aleatoria X, o de su DF, F, es un número denotado por
x p que satisface:
N Si F es una función de distribución continua entonces el valor x p se halla resolviendo la

ecuación
F(x p ) = p
es decir
x p = F −1 (p)
5.4
a) Sea X ∼ U(0, 1) y p = 31 , como FX (x) = x entonces x 1 = 31

3
b) Sea X ∼ N(0, 1) y p = 0.75, entonces x0.75 se halla resolviendo la ecuación (Φ)(x0.75 ) =
0.75, en la tabla de la distribución normal estándar hallamos x0.75 = 0.675
Ejercicios 5.4
1. El angiograma es una prueba de diagnóstico estándar que se utiliza en medicina clínica
para detectar un accidente cerebrovascular en pacientes. Esta prueba tiene algunos riesgos
para el paciente y se han desarrollado varias técnicas no invasivas, que se espera sean tan
eficaces como el angiograma. Uno de estos métodos utiliza la medición de flujo sanguíneo
cerebral (FSC) en el cerebro, ya que los pacientes con accidente cerebrovascular tienden a
tener niveles más bajos de FSC de lo normal. Entre las personas sanas, el FSC se distribuye
normalmente con una media de 75 y desviación estándar 17. Los pacientes se clasifican
como en riesgo de accidente cerebrovascular si su FSC es inferior a 40. ¿Qué proporción de
pacientes normales se clasificará erróneamente como en riesgo de accidente cerebrovascular?
2. La población de estudio son hombres de 35 a 44 años cuyas presiones arteriales se distribu-
yen normalmente con una media 80 y desviación estándar 12. Un hipertenso límite se define
como una persona cuya presión arterial diastólica está entre 90 y 95 mm Hg inclusive.
a) ¿Qué proporción de sujetos tienen hipertensión límite?
b) Un hipertenso es una persona cuya presión arterial diastólica está por encima de 95
mm Hg; ¿Qué proporción de sujetos son hipertensos?
3. Si X ∼ N(0, 4), determine el valor de P(X − X4 ≥ 0)
4. Si X p∼ N(0, 1), determine la función de densidad de probabilidad de la variable aleatoria
Y = |X|
5. Si X ∼ N(0, 1), determine la función de densidad de probabilidad de la variable aleatoria
Y = X2
6. Si X ∼ N(0, 1), determine
a) E(sin(X))
b) E(X cos(X))
X
c) E( 1+X 2)
7. La cantidad de cereal en una caja es normal con media de 400 gramos. Si al responsable de
llenado de las cajas con cereal, es responsable de llenar al menos el 90 % de las cajas de
cereal con 380 gramos o más de cereal, ¿cuál es el valor más grande posible de la desviación
estándar para la cantidad de cereal en una caja?
8. Si X ∼ N(µ, σ 2 ), demuestre que P(|X − µ| > kσ ) no depende de µ ni de σ .
9. Halle el valor esperado y la varianza de la variable aleatoria X cuya función densidad de
probabilidad es
r
2 −2(x−1)2
f (x) = e
π
10. Determine el valor o valores de k de manera que la siguiente sea la función densidad de
probabilidad de una variable normal:
√ 2 2
f (x) = ke−k x −2kx−1 , −∞ < x < ∞
Bivariadas discretas
Bivariadas continuas
Distribuciones condicionales e indepen-
dencia
Independencia, covarianza y correlación
6 — Modelos aleatorios bivariados
Existen muchas situaciones en las cuales es necesario analizar dos o más variables simultáneamente,
para establecer relaciones entre estas o como una o más afecta a una o más variables.
6.1
a) Si un circuito tiene n resistores en paralelo, y X j denota el tiempo de vida útil del

j-ésimo resistor, entonces la función max{X1 , X2 , . . . , Xn } es una variable de interés que
involucra conjuntamente a las n variables.
b) En un canal de comunicación se envían cientos de de bits, para cada bit definimos una
variable que indique si el bit recibido fue el bit enviado; en ese caso necesitaremos
estudiar una variable aleatoria multidimensional.
6.1 Bivariadas discretas

Definición 6.1
Sean X y Y variables aleatorias discretas. La probabilidad que X = x y Y = y, es decir la
probabilidad del evento {X = x} ∩ {Y = y} es denotada por f (x, y) y definida por
f (x, y) = P({X = x} ∩ {Y = y})
usualmente P({X = x} ∩ {Y = y}) se escribe simplemente P(X = x;Y = y), donde el punto y
coma, “;”, representa la intersección de los eventos {X = x} y {Y = y}. La función f (x, y) se
llama función masa de probabilidad conjunta de X y Y , y tiene las siguientes propiedades:
I ) Para todo x, y, 0 ≤ f (x, y) ≤ 1
II ) ∑x ∑y f (x, y) = 1
126 Modelos aleatorios bivariados
6.2
en un sistema de comunicación, un bit aleatorio, 0 o 1, es representado por la variable aleatoria

X. El bit es enviado de una unidad de transmisión a una unidad de recepción, que demodula el
bit en 0 o 1 y que es representado por la variable aleatoria Y . En condiciones ideales, perfectas,
se espera que Y = X, es decir el bit recibido es el mismo bit enviado, pero la realidad es
que por varias causas el bit recibido no es el mismo enviado. Supongamos que la función de
probabilidad conjunta de X y Y está dada por la siguiente tabla de valores:
Y \X X =0 X =1
Y =0 0.50 0.05
Y =1 0.10 0.35
a) Determinar la función masa de probabilidad de X.

X P(X = 0) = P(X = 0;Y = 0)+P(X = 0;Y = 1) = f (0, 0)+ f (0, 1) = 0.50+0.10 = 0.65.
X P(X = 1) = P(X = 1;Y = 0)+P(X = 1;Y = 1) = f (1, 0)+ f (1, 1) = 0.05+0.35 = 0.40.
b) Determinar la función masa de probabilidad de Y .
X P(Y = 0) = P(X = 0;Y = 0)+P(X = 1;Y = 0) = f (0, 0)+ f (1, 0) = 0.50+0.05 = 0.55.
X P(Y = 1) = P(X = 0;Y = 1)+P(X = 1;Y = 1) = f (0, 1)+ f (1, 1) = 0.10+0.35 = 0.45.
Observemos que estas fmp de X y de Y se pueden obtener directamente de la tabla, sumando por
filas y por columnas:
Y \X X =0 X =1 fY (y)
Y =0 0.50 0.05 0.55
Y =1 0.10 0.35 0.45
fX (x) 0.60 0.40
Definición 6.2
Sean X y Y variables aleatorias discretas con fmpc fX,Y . Las fmp de las variables aleatorias,
llamadas función masa de probabilidad marginal, se definen por
a) Marginal de X:
fX (x) = P(X = x) := ∑ fX,Y (x, y)

y
b) Marginal de Y :
fY (y) = P(Y = y) := ∑ fX,Y (x, y)

x
6.3
De las 12 cartas mayores (jotas, reinas y reyes) de una baraja ordinaria de 52 cartas se sacan
tres cartas sin reemplazo. Sea X el número de reyes que se seleccionan y Y el número de jotas.
Calcule
a) La función masa de probabilidad conjunta de X y Y .
b) La probabilidad P((X,Y ) ∈ A), donde A es el evento A = {(x, y) : x + y ≥ 2}
a) Tanto X como Y tienen rango de valores: 0, 1, 2, 3, entonce la fmpc de X y Y está dada por
4 4
 4
P(X = x;Y = y) = x y 3−x−y

x = 0, 1, 2, 3; y = 0, 1, 2, 3
12

f (x, y) = 3

0 otros casos

es decir,

4


 220 x = 0, y = 0
24

x = 1, y = 0




 220
24
x = 2, y = 0


 220


 4
 x = 3, y = 0
 220


 24

x = 0, y = 1
220
f (x, y) = 24
 x = 0, y = 2
 220


4
x = 0, y = 3




 220
64
x = 1, y = 1


220



 24


 220 x = 2, y = 1

 24

x = 1, y = 2
220
b)

24 24 64 4 4 24 24 168
P(X +Y ≥ 2) = P(X +Y = 2)+P(X +Y = 3) = + + + + + + =
220 220 220 220 220 220 220 220
Definición 6.3
La función de distribución conjunta acumulativa de las variables aleatorias X y Y está definida
por
FX,Y (x, y) := P(X ≤ x;Y ≤ y)
Es claro de esta definición que

FX,Y (x, y) = ∑ ∑ fX,Y (s,t)
s≤x t≤y
En el ejemplo anterior tenemos

4 24 24 64 116
FX,Y (1, 1) = f (0, 0) + f (1, 0) + f (0, 1) + f (1, 1) = + + + =
220 220 220 220 220
6.4
Dada la fmpc:
(
Cp(1 − p)x 0 ≤ x ≤ 9, 0 ≤ y ≤ 9
fX,Y (x, y) =
0 otro caso
Sea p = 18
a) Hallar el valor de la constante C para que f sea una fmpc
b) Hallar las funciones marginales de X y Y .
c) Determinar las distribuciones condicionales fX|Y y fY |X
a) Como p = 81 , entonces fX,Y = C 18 ( 78 )x , para 0 ≤ x ≤ 9, 0 ≤ y ≤ 9, entonces

9 9
1 7 x 1 9 7 x

10
∑ ∑ C 8 8 = 1 ⇒ 10C 8 ∑ 8 = 1 ⇒ 8 ·C · (5.8954) = 1 ⇒ C ≈ 0.1357
y=0 x=0 x=0
b) Marginal de X:
9
0.1357 7 x 1.357 7 x

fX (x) = ∑ 8 8 =
y=0 8 8
luego
 x
 1.357 7

0≤x≤9
8 8
fX (x) =
0

otro caso
c) Marginal de Y :
9
0.1357 7 x 1.357 9 7 x

1
fY (y) = ∑ = ∑ =
x=0 8 8 8 x=0 8 10
luego

1 0≤y≤9
fY (x) = 10
0 otro caso
d) Condicional de X dado Y :
x
0.1357 7
8 1.357 7 x

fX,Y (X,Y ) 8
fX|Y (x|y) = = 1
= = fX (x)
fY (y) 10
8 8
e) Condicional de X dado Y :
x
7
0.1357
fX,Y (X,Y ) 88 1
fY |X (y|x) = = x = = fY (y)
fX (x) 1.357 7 10
8 8
6.5
La entrada X a un canal de comunicación es −1 o 1, con probabilidades 14 y 34 , respectivamente.

La salida Y , del canal, es igual a las correspondientes entradas X con probabilidades 1 − p − pε ,
−X con probabilidad p, y 0 con probabilidad pε
a) Describir el rango de la variable aleatoria bidimensional (X,Y ) y establecer la fmpc de
X y Y.
b) Hallar la probabilidad de los eventos {X 6= Y } y {Y = 0}.
c) Suponga que p = 12 y pε = 0.1
a) El rango de la variable (X,Y ) está dado por
SX,Y = {(−1, −1), (−1, 0), (−1, 1), (1, −1), (1, 0), (1, 1)}
La función masa de probabilidad conjunta de X y Y está dada por

X P(X = −1,Y = −1) = P(Y = −1|X = −1) · P(X = −1) = (1 − p − pε ) · 41 = 1−p−p 4
ε
1 pε
X P(X = −1,Y = 0) = P(Y = 0|X = −1) · P(X = −1) = (pε ) · 4 = 4
X P(X = −1,Y = 1) = P(Y = 1|X = −1) · P(X = −1) = (p) · 14 = 4p
X P(X = 1,Y = −1) = P(Y = −1|X = 1) · P(X = −1) = (p) · 43 = 3p 4
X P(X = 1,Y = 0) = P(Y = 0|X = 1) · P(X = 1) = (pε ) · 34 = 3p4 ε
ε)
X P(X = 1,Y = 1) = P(Y = 1|X = 1) · P(X = 1) = (1 − p − pε ) · 43 = 3(1−p−p
4
Resumimos esta fmpc de X y Y con la siguiente tabla, junto con las marginales de X y de Y .
X \Y −1 0 1 fX (x) = P(X = x)
1−p−pε pε p 1
−1 4 4 4 4
3p 3pε 3(1−p−pε ) 3
1 4 4 4 4
1−pε p 3(1−pε )
fY (y) = P(Y = y) 4 +2 pε 4 − 2p
b) P(Y = 0) = fY (0) = pε
P(X 6= Y ) = 1 − P(X = Y ) = 1 − fX,Y (−1, −1) − fX,Y (1, 1)

1 − p − pε 3(1 − p − pε )
= 1− −
4 4
= p + pε
6.6
En una reserva natural, que incluye turismo controlado, un turista llega a un punto que se
bifurca en tres caminos posibles. El primer camino retorna al turista a este mismo punto luego
de una hora de viaje; el segundo camino devuelve al turista al mismo punto luego de seis
horas de recorrido, y el tercer camino lleva al turista de regreso a la entrada de la reserva
natural, luego de dos horas de caminata. Infortunadamente, la reserva no cuenta con sistema
de señalización para orientar a los turistas. Suponga que el turista selecciona un camino con
igual probabilidad, todas las veces. Determinar el tiempo medio hasta que el turista llegue a la
entrada de la reserva.
Denotemos con T la variable aleatoria “tiempo que le toma al turista llegar a la entrada de la
reserva”, y con B j el evento “el turista escoge el camino j”, j = 1, 2, 3. El objetivo es calcular E(T ).
E(T ) = E(T |C1 )P(C1 ) + E(T |C2 )P(C2 ) + E(T |C3 )P(C3 )

1
= E(T |C1 ) + E(T |C2 )) + E(T |C3 ) ·
3

3E(T ) = (1 + E(T )) + (6 + E(T )) + 2
⇒ E(T ) = 9
6.7
Un revendedor está considerando comprar boletos para el próximo partido de fútbol de la

selección. El precio de cada boleto es de $180, 000 y el revendedor los venderá a $400, 000.
Sin embargo, si no puede venderlos a $400, 000, entonces no los venderá en absoluto. La
demanda de este tipo de boletos es una variable aleatoria binomial con parámetros n = 100 y
p = 21 , ¿cuántas entradas debería comprar para maximizar su ganancia esperada?
Denotemos con N el número de boletas que el revendedor comprará, y con D la demanda de

estos boletos. Si V es el número de boletos vendidos, entonces V = min{N, D}, y la ganancia del
revendedor será
G(N) := 4V − 1.8N; en cientos de miles
Entonces
E(G(N)) = 4E(V ) − 1.8N
observemos que V es aleatoria pero N no. Hemos de condicionar a N de manera que N ≤ 100 porque
no es óptimo financieramente comprar más boletos que la demanda máxima. Calculemos E(V )
E(V ) = E(D|D ≤ N)P(D ≤ N) + E(D|D > N)P(D > N)

= E(D|D ≤ N)P(D ≤ N) + NP(D > N)
N 100 100 100
100 1 100 1
= ∑k +N ∑
k=0 k 2 k=N+1 k 2
100 N 100
1 100 100
= ∑ k +N ∑
2 k=0 k k=N+1 k
100 100
1 100
= 50 + ∑ N − k ·
k=N+1 2 k
luego
100 100
1 100
E(G(N)) = 200 + 4 · ∑ N − k · − 1.8N
k=N+1 2 k
El valor de N se halla, generando los cien valores posibles de E(G(N)) para N = 0, 1, . . . , 100 y
seleccionando el valor de N que da el máximo de E(G(N)).
6.2 Bivariadas continuas
Definición 6.4
Sean X y Y variables aleatorias continuas. La función de densidad de probabilidad conjunta
de X y Y , es una función integrable f tal que
I ) Para todo (x, y) ∈ R2 , f (x, y) ≥ 0
R∞ R∞
II ) −∞ −∞ f (x, y)dA = 1
6.8
Dos componentes electrónicos, C1 y C2 , de un sistema de proyectiles funcionan en conjunto

para el éxito de todo el sistema. Sean X y Y la vida en horas de los dos componentes C1 , C2 ,
respectivamente. La función densidad de probabilidad conjunta de X y Y es
(
ye−y(1+x) x ≥ 0, y ≥ 0
f (x, y) =
0 otro caso
Determinar
a) la probabilidad que el componente 1 dure menos tiempo que el componente 2.
b) la probabilidad que ambos componentes duren más de tres horas.
a) la probabilidad que el componente 1 dure menos tiempo que el componente 2 está dada por
Z ∞Z y
P(X < Y ) = ye−y(1+x) dxdy
0 0
Z ∞ x=y
−y(x+1)

= −e dy
0

x=0
Z ∞
−y(y+1)
= (−e + e−y )dy
0
Z ∞ Z ∞
2 −y
=− e−y dy + e−y dy
0 0
≈ 0.4544
b) la probabilidad que ambos componentes duren más de tres horas:

Z ∞Z ∞
P(X > 3;Y > 3) = ye−y(1+x) dxdy
3 3
Z ∞ x=∞
−y(x+1)

= −e dy
3

x=0
Z ∞
−y
= e dy
3
−3
=e
≈ 0.04979
Definición 6.5
Sean X, Y variables aleatorias continuas con fdpc f (x, y). Las distribuciones marginales de X
y Y están dadas por
I ) Marginal de X:
Z ∞
fX (x) := f (x, y)dy
−∞
II ) Marginal de Y :
Z ∞
fY (y) := f (x, y)dx
−∞
6.9
Sean X, Y , variables aleatorias continuas con fdpc


 3 si 0 ≤ x2 < y < 2x ≤ 4
f (x, y) = 4
0 en otro caso
La región donde está definida la función densidad de probabilidad conjunta es dada a conti-
nuación:
a) Hallar las fdp marginales de X y de Y .

b) Determinar la probabilidad del evento A = {X < 1;Y > 1}
a) Marginal de X:
Z 2x
3
fX (x) = dy
2 4
(x
3 2
4 (2x − x ) si 0 ≤ x ≤ 2
=
0 otro caso
b) Marginal de Y :
Z √y
3
fY (y) = dx
y
2
4
( √
3 y
4 ( y − 2 ) si 0 ≤ y ≤ 4
=
0 otro caso
c) Probabilidad del evento A = {X < 1;Y > 1}

Z 1Z 2
3
P(X < 1;Y > 1) = dydx
0.5 1 4
3
=
8
Definición 6.6
Sean X y Y variables aleatorias continuas, con fdpc fX,Y . La función de distribución conjunta
acumulativa de X y Y , denotada FX,Y está definida por
Z x Z y
FX,Y (x, y) := fX,Y (s,t)dtds
−∞ −∞
Aplicando el teorema fundamental del cálculo se obtiene:

∂ 2F
= fX,Y (x, y)
∂ x∂ y
6.10
Hallar la fdpc de las variables aleatorias X y Y cuya función de distribución conjunta acumula-
tiva es
F(x, y) = (1 − e−β x )(1 − e−β y ), x > 0, y > 0, (β > 0 un parámetro)
∂ 2F
f (x, y) = = β 2 e−β (x+y) , x > 0, y > 0
∂ x∂ y
6.3 Distribuciones condicionales e independencia
Definición 6.7
Sean X y Y variables aleatorias con función densidad de probabilidad conjunta fX,Y .
I ) La función densidad de probabilidad condicional de X dado el evento Y = y se define
por
fX,Y (x, y)
fX|Y =y (x|y) := , fY (y) > 0
fY (y)
II ) La función densidad de probabilidad condicional de Y dado el evento X = x se define

por
fX,Y (x, y)
fY |X=x (y|x) := , fX (x) > 0
fX (x)
X Dadas fX|Y (x|y) y fY (y) entonces fX,Y (x, y) = fX|Y (x|y) y fY (y) · fY (y).
X Dadas fY |X (y|x) y fX (x) entonces fX,Y (x, y) = fY |X (y|x) y fX (x) · fX (x).
6.11
Si
2y + 4x 1 + 4x
fY |X (y|x) = ; fX (x) = para 0 < x < 1, 0 < y < 1
1 + 4x 3
Determinar:
a) P(X +Y ≤ 1)
b) E(Y )
c) E(X|Y = 12 )
Dadas fY |X y fX , entonces fX,Y = fY |X · fX , por tanto

 2y + 4x si 0 < x < 1, 0 < y < 1
fX,Y (x, y) = 3
0 otro caso
a)
Z 1Z x
2y + 4x
P(X +Y ≤ 1) = dydx
0 0 3
1
x
1
Z
2

= y + 4xy dx
3 0 0
1 1 2
Z
= (x + 4x2 )dx
3 0
1 5 3 1

= x
3 3 0
5
=
9
b) Hallemos primero la fdp marginal de Y :
Z 1
2y + 4x
fY (y) = dx
0 3
1
1 2

= (2yx + 2x )
3 0

 2y + 2 si 0 < y < 1
= 3
0 otro caso
Entonces
1
1 2y3
Z 1
2y + 2 2
1 2 5
E(Y ) = y· dy = +y = · +1 =
0 3 3 3 0 3 3 9
c) Primero hallemos las fdp condicional de X dado que Y = 12 :

1+4x
1 fX,Y (x, 21 ) 3 1 + 4x
fX|Y (x| ) = = = para 0 < x < 1
2 fY ( 21 ) 1 3
Z 1
1 1
E(X|Y = ) = x · fX|Y (x| )dx
2 0 2
Z 1
1 + 4x
= x· dx
0 3
1 1
Z
= (x + 4x2 )dx
3 0
1 x2 4x3 1

= +
3 2 3
0
1 1 4
= +
3 2 3
11
=
18
Definición 6.8
Supongamos que Y = y, condicionando sobre este evento la nueva distribución de X tiene fmp
o fdp condicional fX|Y (x|y) que es función de x, y el valor esperado de esta variable aleatoria
X|y está definido por
Z ∞
E(X|y) := x fX|Y (x|y)dx, o bien E(X|y) := ∑ x fX|Y (x|y)
−∞ x
Definición 6.9
Dado el evento Y = y la esperanza condicional E(X|y) es una función de y, digamos g(y) :=
E(X|y). Entonces g(Y ) es una variable aleatoria, con fdp fY , llamada esperanza condicional
y denotada E(X|Y )
6.12
Supongamos que se selecciona aleatoriamente un punto en [0, 1], y luego se selecciona un

segundo punto entre el anterior y 1. determinar la esperanza condicional del segundo dado el
primero.
Sea X el primer punto seleccionado, entonces X ∼ U[0, 1], si Y es el segundo punto seleccionado
entonces Y |X = x ∼ U[x, 1].
a) Intuitivamente E(Y |X = x) = x+1
2 . Vamos a demostrarlo.
b) Distribución condicional de Y dado X:
(
1
1−x si x < y < 1
fY |X (y|x) =
0 otros casos
c) Esperanza condicional:
2 1
1 − x2 1 + x
Z 1
1 1 y 1
E(Y |X = x) = y dy = = · =
x 1−x 1−x 2 x 1−x 2 2
por tanto
1+X
E(Y |X) =
2
En el análisis multivariado, una de las tareas importantes es establecer a partir del modelo conjunto
algunos estadísticos como la media y la varianza de una de las variables, es decir la media y la
varianza incondicional de una de las variables a partir de la media o varianza condicional respecto
de otra u otras variables.
Proposición 6.1
La esperanza condicional E(X|Y ) satisface
E(E(X|Y )) = E(X)
En efecto
X Caso discreto
E(E(X|Y )) = ∑ E(X|y) fY (y)

y

=∑ ∑ x fX|Y (x|y) fY (y)
y x

= ∑ x ∑ fX|Y (x|y) fY (y)
x y

= ∑ x ∑ fX,Y (x, y)
x y
= ∑ x fX (x)
x
= E(X)
X Caso continuo
Z ∞
E(E(X|Y )) = E(X|y) fY (y)dy
−∞
Z ∞ Z ∞
= x fX|Y (x|y)dx fY (y)dy
−∞ −∞
Z ∞ Z ∞

= x fX|Y (x|y) fY (y)dy dx
−∞ −∞
Z ∞ Z ∞
= x fX,Y (x, y)dy dx
−∞ −∞
Z ∞
= x fX (x)dx
−∞
= E(X)
6.13
El 60 % de una población mayor son mujeres y el resto, 40 %, son hombres. Suponga que
el peso promedio de las mujeres es 70 kilogramos, mientras que el peso promedio de los
hombres es de 85 kilogramos. ¿Cuál es el peso promedio de esta población mayor?
Sean M peso de esta población mayor y G el género, entonces

E(M) = E(E(M|G))
= E(M|G = f ) · P(G = f ) + E(M|G = m) · P(G = m)
= 70 · (0.6) + 85 · (0.4)
= 76 kilogramos
Definición 6.10
Sean X y Y variables aleatorias. Se define la varianza de X dado el evento Y = y, conocida
como la varianza condicional de X dado Y = y, de la siguiente manera:
Var(X|Y = y) := E(X 2 |Y = y) − (E(X|Y = y))2
N
X La varianza condicional Var(X|y) se calcula como una función de X, y para su cálculo
se utiliza la distribución condicional fX|y .
X Para cada valor y, Var(X|y) es una función de y entonces Var(X|Y ) es una variable
aleatoria con fdp fY
6.14
Sean X y Y variables aleatorias discretas con fmpc siguiente:
X\Y −1 1
1 0.2 0.4
2 0.3 0.1
a) Distribuciones marginales: fX (1) = 0.6, fX (2) = 0.4; fY (−1) = 0.5, fY (1) = 0.5.
b) Distribución condicional de X dado Y = y:
(
0.4 x = 1
fX|Y (x| − 1) =
0.6 x = 2
(
0.8 x = 1
fX|Y (x|1) =
0.2 x = 2
c) Momentos condicionales asociados a X|Y = y:

X E(X|Y = −1) = 1 · (0.4) + 2 · (0.6) = 1.6
X E(X|Y = 1) = 1 · (0.8) + 2 · (0.2) = 1.2
X E(X 2 |Y = −1) = 12 · (0.4) + 22 · (0.6) = 2.8
X E(X 2 |Y = 1) = 12 · (0.8) + 22 · (0.2) = 1.6
X Var(X|Y = −1) = (2.8) − (1.6)2 = 0.24
X Var(X|Y = 1) = (1.6) − (1.2)2 = 0.16

d) Distribución condicional de Y dado X = x:
(
1
y = −1
fY |X (y|1) = 23
3 y=1
(
3
4 y = −1
fY |X (y|2) = 1
4 y=1
e) Valor esperado doble:
E(E(X|Y )) = E(X| − 1) · fY (−1) + E(X|1) · fY (1) = (1.6) · (0.5) + (1.2) · (0.5) = 1.4
Observemos que
E(X) = 1 · (0.6) + 2 · (0.4) = 1.4
que ilustra E(E(X|Y )) = E(X).
Proposición 6.2
Sean X y Y variables aleatorias, con primeros y segundos momentos condicionales finitos,
entonces
Var(X) = E(Var(X|Y )) + Var(E(X|Y ))
en efecto
 

 2

2 2 2
E(Var(X|Y )) + Var(E(X|Y )) = E E(X |Y ) − (E(X|Y )) + E (E(X|Y )) − E(E(X|Y )

 | {z }  
E(X)

= E(E(X 2 |Y )) − 2
E[(E(X|Y
)) ] + 2
E[(E(X|Y
)) ] − (E(X))2
| {z }
E(X 2 )
= E(X 2 ) − (E(X))2
= Var(X)
Ilustramos este resultado con los datos del ejemplo anterior:
X
Var(X) = E(X 2 ) − (E(X))2
2
= 12 · (0.6) + 22 · (0.4) − 1 · (0.6) + 2 · (0.4)
= 2.2 − (1.4)2
= 0.24
X

E(Var(X|Y )) = (0.24) · (0.5) + (0.16) · (0.5) = 0.20
2
2 2
Var(E(X|Y )) = (1.6) · (0.5) + (1.2) · (0.5) − (1.6) · (0.5) + (1.2) · (0.5) = 0.04
Entonces
E(Var(X|Y )) + Var(E(X|Y )) = 0.24
Y por tanto se ha ejemplificado la identidad:
Var(X) = E(Var(X|Y )) + Var(E(X|Y ))
6.4 Independencia, covarianza y correlación

Recordemos que en un espacio de probabilidad (Ω, F, P) los eventos A y B son independientes si y
solamente si P(A ∩ B) = P(A)P(B).
En esta sección presentaremos la noción de independencia estocástica de dos o más variables
aleatorias.
Definición 6.11
Sean X y Y variables aleatorias con fdpc fX,Y y fdp marginales fX y fY . X y Y son indepen-
dientes si y solamente si fX,Y (x, y) = fX (x) fY (y) para todo x, y.
De manera similar se establece la noción de independencia para variables aleatorias discretas.
6.15
Sean X y Y variables aleatorias con fdpc dada por

(
e−(x+y) x ≥ 0, y ≥ 0
fX,Y (x, y) =
0 otro caso
Entonces
∞

X fX (x) = 0∞ e−(x+y) dy = e−x 0∞ e−y dy = e−x −e−y , entonces
R R
0
(
e−x x≥0
fX (x) =
0 x<0
X Similarmente
(
e−y y≥0
fY (y) =
0 y<0
X fX,Y (x, y) = fX (x) fY (y), para todo x ≥ 0, y ≥ 0.
Por tanto X y Y son variables aleatorias independientes.
6.16
Determinar si X y Y son independientes, donde su fdpc es:

(
24x(1 − x − y) x ≥ 0, y ≥ 0, x + y ≤ 1
fX,Y (x, y) =
0 otro caso
Región de soporte de la fdpc de X y Y
a) Distribución marginal de X:
Z 1−x
fX (x) = 24x(1 − x − y)dy
0
Z 1−x
= 24x (1 − x − y)dy
0
y2 y=1−x

= 24x (1 − x)y −
2 y=0
(1 − x)2

2
= 24x (1 − x) −
2
(
12x(1 − x)2 0 ≤ x ≤ 1
fX (x) =
0 otro caso
b) Distribución marginal de Y :
Z 1−y
fY (y) = 24x(1 − x − y)dx
0
Z 1−y
= 24 (x(1 − y) − x2 )dx
0
x2 x3 x=1−y

= 24 (1 − y) −
2 3 x=0
(1 − y)3 (1 − y)3

= 24 −
2 3
= 4(1 − y)3
(
4(1 − y)3 0≤y≤1
fY (y) =
0 otro caso
Claramente fX (x) · fY (y) 6= fX,Y (x, y), por tanto X y Y son variables dependientes.
N
X Si X y Y son variables aleatorias independientes entonces
fX|Y (x|y) = fX (x), ∀y, fY (y) 6= 0
X La varianza de la variable aleatoria X, denotada Var(X) o bien σX2 , es una medida de
dispersión de los datos de X respecto de su media µX .
Teorema 6.1
Sean X y Y son variables aleatorias independientes con fdp fX y fY , respectivamente. g(X) y
h(Y ), funciones de X y Y , entonces

E g(X)h(Y ) = E(g(X))E(h(Y ))
Como Xy Y son independientes entonces la fdp conjunta de X y Y es fX,Y (x, y) = fX (x) fY (y),
entonces
Z∞Z∞
E g(X)h(Y ) = g(x)h(y) fX,Y (x, y)dydx
−∞ −∞
Z ∞Z ∞
= g(x)h(y) fX (x) fY (y)dydx
−∞ −∞
Z ∞ Z ∞
= g(x) fX (x) h(y) fY (y)dy dx
−∞ −∞
Z ∞
= g(x) fX (x)dx
−∞
Z ∞
= E(h(Y )) g(x) fX (x)dx
−∞
= E(h(Y ))E(g(X))
= E(g(X))E(h(Y ))
6.17
Sean X ∼ U(0, π), Y ∼ U(−1, 1), g(x) = sin(x), h(y) = e−|y| , entonces
E(sin(X)e−|Y | ) = E(sin X)E(e−|Y | )
ahora bien
1 2
Z π
E(sin X) = sin(x)dx =
0 π π
Z 1 Z 1
1 −|y|
E(e−|Y | ) = e dy = e−y dy = 1 − e−1
−1 2 0
luego
2
E(sin(X)e−|Y | ) = · (1 − e−1 )
π
Una medida de dispersión conjunta de dos variables aleatorias, respecto de sus valores medios, es la
covarianza que se define a continuación.
Definición 6.12
Sean X y Y variables aleatorias conjuntamente distribuidas. La varianza conjunta de X y Y ,
denominada covarianza de X y Y se denota por Cov(X,Y ) o simplemente C(X,Y ), y está
definida por
Cov(X,Y ) := E[(X − µX )(Y − µY )]
Proposición 6.3
Cov(X,Y ) = E(XY ) − E(X)E(Y )
En efecto
Cov(X,Y ) = E[(X − µX )(Y − µY )]

= E(XY − µY X − µX Y + µX µY )
= E(XY ) − E(µY X) − E(µX Y ) + E(µX µY )
= E(XY ) − µY E(X) − µX E(Y ) + µX µY
= E(XY ) − µY µX −
µXY +
µ µX
µ
Y
= E(XY ) − µX µY
= E(XY ) − E(X)E(Y )
6.18
Sean X y Y variables aleatorias con fdpc

(
1
|x| + |y| ≤ 1
f (x, y) = 2
0 otro caso
Hallar la covarianza de X y Y
Región soporte de la distribución de X y Y :
a)
Z 1 Z 1−|x|
1
E(X) = x · dydx
−1 −1+|x| 2
Z 1 1−|x|
1
= x y
2 −1 −1+|x|
Z 1
1
= x · (2 − 2|x|)dx
2 −1
Z 1
= x(1 − |x|)dx integral de una función impar en intervalo simétrico al origen
−1
=0
b)
Z 1 Z 1−|y|
1
E(Y ) = y · dxdy
−1 −1+|y| 2
=0 como en el caso de X
c)
Z 1 Z 1−|x|
1
E(XY ) = xy · dydx
−1 −1+|x| 2
Z 1 2 1−|x|
1 y
= x
2 −1 2 −1+|x|
1 1
Z
= x[(1 − |x|)2 − (−1 + |x|)2 ]dx
4 −1
1 1
Z
= x · 0dx
4 −1
=0
Entonces Cov(X,Y ) = 0. Este es un ejemplo de dos variables no independientes (demostrarlo) cuya

covarianza es cero.
La covarianza de variables aleatorias tiene unas propiedades importantes, que nos recuerdan al
producto interior.
Teorema 6.2
Sean X, Y y Z variables aleatorias distribuidas conjuntamente, , y b constantes reales fijas.
Entonces
I ) Cov(X, X) = Var(X) no negatividad.
II ) Cov(X,Y ) = Cov(Y, X) simetría.
III ) Cov(aX,Y ) = aCov(X,Y ) homogeneidad en la primera componente (y también en la
segunda, por simetría).
IV ) Cov(aX + bY, Z) = aCov(X, Z) + bCov(Y, Z) linealidad en la primera componente, y
en la segunda por simetría; es decir bilinealidad.
V ) Cov(X, a) = 0
En efecto
I) Cov(X, X) = E(XX) − E(X)E(X) = E(X 2 ) − µX2 = Var(X)
II ) Cov(X,Y ) = E(XY ) − E(X)E(Y ) = E(Y X) − E(Y )E(X) = Cov(Y, X)
III )
Cov(aX,Y ) = E(aXY ) − E(aX)E(Y )

= aE(XY ) − aE(X)E(Y )

= a E(XY ) − E(X)E(Y )
= aCov(X,Y )
IV )
Cov(aX + bY, Z) = E[(aX + bY )Z] − E(aX + bY )E(Z)

= E[aXZ + bY Z] − (aE(X) + bE(Y ))E(Z)
= E(aXZ) + E(bY Z) − aE(X)E(Z) − bE(Y )E(Z)
= aE(XZ) + bE(Y Z) − aE(X)E(Z) − bE(Y )E(Z)

= a E(XZ) − E(X)E(Z) + b E(Y Z) − E(Y )E(Z)
= aCov(X, Z) + bCov(Y, Z)
V) Cov(X, a) = E(Xa) − E(X)E(a) = E(X)E(a) − E(X)a = E(X)a − E(X)a = 0
Definición 6.13
Sean X y Y variables aleatorias tales que Cov(X,Y ) = 0, entonces X y Y se llaman variables
no correlacionadas.
Teorema 6.3
Si X y Y son variables aleatorias independientes entonces X y Y son no correlacionadas.
En efecto, denotemos con fX y fY las funciones densidad de probabilidad de X y Y , respectivamente,

entonces por independencia la fdpc de X y Y es f X,Y (x, y) = fX (x) · fY (y), por tanto:
Cov(X,Y ) = E(XY ) − E(X)E(Y )

Z ∞Z ∞
= xy fX,Y (x, y)dydx − E(X)E(Y )
Z−∞ −∞
∞ Z ∞
= xy fX fY (y)(x, y)dydx − E(X)E(Y )
−∞ −∞
Z ∞ Z ∞
= x fX y fY (y)dy dx − E(X)E(Y )
−∞ −∞
Z ∞
= x fX E(Y ) dx − E(X)E(Y )
−∞
Z ∞
= E(Y ) x fX dx − E(X)E(Y )
−∞
= E(Y )E(X) − E(X)E(Y )
=0
N La medida de covarianza tiene el problema de depender de las unidades de medida de las

variables, característica que complica una interpretación más precisa de la asociación entre las
variables.
Definición 6.14
Sean X y Y variables aleatorias con primeros y segundos momentos finitos. Definimos el
coeficiente de correlación entre X y Y por
Cov(X,Y )
ρX,Y :=
σX σY
siendo σX y σY las desviaciones estándar de X y Y , respectivamente.
6.19
Sean X y Y variables aleatorias con fdpc dada por

(
6x2 (1 − y) 0 < x < 1, 0 < y < 1
f (x, y) =
0 otro caso
Hallar el coeficiente de correlación entre X y Y
a) Función de densidad marginal de X:

(
3x2
Z 1 Z 1
2 2 0<x<1
fX (x) = 6x (1 − y)dy = 6x (1 − y)dy =
0 0 0 otro caso
b) Función de densidad marginal de Y :

(
2(1 − y) 0 < y < 1
Z 1 Z 1
fY (y) = 6x2 (1 − y)dx = 6(1 − y) x2 dx =
0 0 0 otro caso
c) De los dos numerales anteriores, se sigue que X y Y son independientes.

Cov(X,Y )
d) Como ρX,Y = , entonces ρX,Y = 0 ⇔ Cov(X,Y ) = 0. De la independencia de X y
σX σY
Y se sigue que Cov(X,Y ) = 0 y por tanto ρX,Y = 0.
N La covarianza, o el coeficiente de correlación, es una medida de la asociación lineal entre las

variables X y Y .
Proposición 6.4
Sea X una variable aleatoria tal que E(X) = µ < +∞, entonces Var(X) = 0 si y solo si
P(X = µ) = 1
Teorema 6.4
Sean X y Y variables aleatorias con primeros y segundos momentos finitos. Entonces
|ρX,Y | ≤ 1
En efecto
X − µX Y − µY 2

E ± ≥0
σX σY
X − µX 2 Y − µY 2

(X µX )(Y − µY )
E + ± 2E ) ≥0
σX σY σX − σY

E (X − µX )(Y − µY )
E[(X − µX )2 ] E[(Y − µy )2 ]
+ ± 2 ≥0
σX2 σY2 σX σY
σX2 σY2
+ ± 2ρXY ≥ 0
σX2 σY2
2 ± 2ρXY ≥ 0
−1 ≤ ρXY ≤ 1
N
X De la prueba anterior se sigue:
X − µX Y − µY
ρXY = ±1 ⇐⇒ =± con probabilidad 1
σX σY
es decir,
X − µX Y − µY
I) Si ρX,Y = 1, entonces = , por tanto, despejando Y , tenemos:
σX σY

σY σY
Y − µY = X+ − µX
σX σX
X − µX Y − µY
II ) Si ρX,Y = −1, entonces =− , por tanto, despejando Y , tenemos:
σX σY

σY σY
Y − µY = − X+ µX
σX σX
X En general ρXY es una medida que tanto Y − µY se puede aproximar o estimar por una
función lineal de X − µX
Ejercicios
1. Un dado legal se lanzan dos veces. Sean X la variable aleatoria “el máximo de las dos caras”
y Y “la suma de las dos caras”, en los dos lanzamientos.
a) Hallar la función masa de probabilidad conjunta de X y Y .
b) Hallar E(X|Y = 7)
c) Hallar Var(X|Y = 7)
d) Hallar E(Y |X = 5)
e) Hallar Var(Y |X = 5)
f ) Hallar Cov(X,Y )
2. Sean X ∼ U(−1, 1) y Y ∼ U(0, 1). Hallar la probabilidad que la ecuación cuadrática tenga
raíces reales.
t 2 + 2Xt +Y = 0
√
3. Sean X ∼ U(0, 1) y Y |X = x ∼ U(0, x). Hallar la función de densidad de probabilidad
marginal de la variable aleatoria Y .
4. La función de distribución acumulativa de X y Y es
(
(1 − e−x )(1 − e−y ) x > 0, y > 0
FX,Y (x, y) =
0 otras partes
Hallar
a) P(1 < X < 3, 1 < Y < 4)
b) fX,Y (ln 2, − ln 4)
c) Sin hacer cálculos, son las variables aleatorias independientes?. Explique.
d) Sin hacer cálculos, hallar la función de densidad de probabilidad de X y determinar que
tipo de modelo es.
5. Si las variables aleatorias X y Y tienen función de densidad de probabilidad
(
24xy 0 < x + y < 1, x > 0, y > 0
fX,Y (x, y) =
0 otras partes
Determinar
a) P(Y ≤ X)
b) P(X < 21 ;Y < 21 )
c) P(X < 12 |Y = 41 )
d) P(X < 12 |Y < 41 )
(
6x
1 ≤ x + y ≤ 2, x ≥ 0, y ≥ 0
fX,Y (x, y) = 7
0 otras partes
Determinar
a) P(Y ≥ X 2 )
b) P(max{X,Y } > 1).
7. Si las variables aleatorias X y Y tienen función de densidad de probabilidad conjunta
( √
4x 0 < x < y < 1
fX,Y (x, y) =
0 otras partes
Determinar la función de densidad de probabilidad marginal de Y .
( 2
5xy
0<x<y<2
fX,Y (x, y) = 16
0 otras partes
Determinar
a) fX (x)
b) fY |x (y|x).
c) E[Y |X = x]
d) E[Y |X]
9. Suponga que X es uniformemente distribuida sobre {1, 2, 3}, y dado que X = j, Y es unifor-
memente distribuida sobre el intervalo [0, j]-
a) Hallar la función de probabilidad conjunta de X y Y .
b) Hallar la función de densidad de probabilidad de Y .
c) Hallar la función de densidad de probabilidad condicional de X dado que Y = y, para
y ∈ [0, 3]
10. Suponga que N ∼ Poiss(λ = 2) y que dado que N = n, Y se distribuye binomial con parámetro
n y p = 34 .
a) Hallar la función de probabilidad conjunta de N y Y .
b) Hallar la función de densidad de probabilidad de Y .
c) Hallar la función de densidad de probabilidad condicional de N dado que Y = k, para k
un número entero entre 0 y n
11. Hallar la fdp condicional de cada variable aleatoria dado un valor de la otra, y determine si las
variables son independientes, en cada uno de los siguientes casos:
a) (X,Y ) es uniformemente distribuida en Ω = {(x, y) : −6 ≤ x ≤ 6, −6 ≤ y ≤ 6}
b) (X,Y ) es uniformemente distribuida en Ω = {(x, y) : −6 ≤ y ≤ x ≤ 6}
c) (X,Y ) es uniformemente distribuida en Ω = {(x, y) : x2 + y2 ≤ 36}
d) (X,Y ) es uniformemente distribuida en Ω = {(x, y) : |x| + |y| ≤ 6}
12. Se selecciona aleatoriamente un punto (X,Y ) de una distribución uniforme sobre el disco
unitario de centro en (1, 1). Para un valor x dado, de la variable aleatoria X, en el intervalo
abierto (0, 2) y para un valor apropiado de y, en su dominio, determinar la función de densidad
de probabilidad condicional fY |x
13. Sean X y Y variables aleatorias independientes e idénticamente distribuidas con modelo
común uniforme en el intervalo [0, 1]. Hallar la probabilidad del evento {Y ≥ 12 } dado que
Y ≥ 1 − 2X.
14. Sean X y Y variables aleatorias independientes e idénticamente distribuidas, ambas exponen-
ciales con media igual a 1. Determinar la función de densidad de probabilidad de la variable
aleatoria W definida por W = max{X,Y }
15. Suponga que (X,Y, Z) se distribuye uniformemente en la región:
Ω = {(x, y, z) ∈ R3 : 0 ≤ x ≤ y ≤ z ≤ 1}
a) Hallar la función densidad de probabilidad condicional de cada par de variables aleatorias,

dado un valor de la tercera variable.
b) Hallar la función densidad de probabilidad condicional de cada variables aleatoria, dado
un valor de las otras dos variables.
16. Suponga que (X,Y ) tiene fdp conjunta
1 − x2 − y2
f (x, y) = e 8 18 si (x, y) ∈ R2
12π
a) Hallar la fdp condicional de X dado que Y = y.
b) Hallar la fdp condicional de Y dado que X = x.

c) ¿Son X y Y variables aleatorias independientes? Explique
17. Suponga que (X,Y ) tiene fdp conjunta
1 2 2
f (x, y) = √ e−x −xy−y si (x, y) ∈ R2
2π
a) Hallar la fdp condicional de X dado que Y = y.
b) Hallar la fdp condicional de Y dado que X = x.
c) ¿Son X y Y variables aleatorias independientes? Explique
18. Sean X y Y variables aleatorias independientes e idénticamente distribuidas, ambas con misma
función de densidad de probabilidad
( 2
3x
3 para 0 ≤ x ≤ b
f (x) = b
0 otro caso
Determinar la función de densidad de probabilidad de la variable aleatoria W definida por

W = min{X,Y }
19. Una ruta de transporte público llega a un paradero a un tiempo aleatorio distribuido uniforme-
mente en el intervalo horario que va de las 6 : 00 a.m. y las 6 : 15 a.m.. Un pasajero usuario
de esta ruta llega al mismo paradero a un tiempo aleatorio distribuido uniformemente en el
intervalo horario que va de las 6 : 00 a.m. y las 6 : 15 a.m.. Suponga que los tiempos de llegada
de la ruta y del pasajero son independientes. El pasajero esperará la ruta por no más de 10
minutos. Determinar la probabilidad de que el pasajero tome la ruta.
20. Silvia y Camilo acuerdan encontrarse entre las 6 : 25 a.m. y las 6 : 55 a.m., en la cafetería
antes de ingresar a una prueba de probabilidad. Suponga que cada uno de ellos llega a un
tiempo aleatorio distribuido uniformemente en este intervalo de tiempo, independientemente
del otro. Cada uno esperará por el otro a lo más 10 minutos (de no llegar el otro se irán para el
aula de clase). Hallar la probabilidad que ellos realmente se vayan.
21. Sean X y Y variables aleatorias con función de densidad de probabilidad conjunta

1 si 0 ≤ x ≤ y ≤ 1


fX,Y (x, y) = 1
2 si 1 ≤ x ≤ 2, 0 ≤ y ≤ 1


0 otro caso
Determinar
a) fX (x)
b) fY |x (y|x).
c) E[Y |X = x]
d) P(X ≤ 32 ;Y ≤ 21 )
e) P(Y ≤ 21 |X ≤ 23 )
22. Sean X ∼ gamm(α, λ ), Y∼ gamm(β , λ ), variables aleatorias independientes. Hallar:
X
a) la distribución conjunta de U = X +Y y V = X+Y .
b) P(U ≤ 1)
c) E(U|V ≤ 12 )
d) P(V ≥ 2)
23. Sean X y Y variables aleatorias normal estándar, independientes. Hallar:
a) la distribución conjunta de U = X y V = X +Y .
b) Var(V )
c) ρU,V
d) ¿Son U y V variables aleatorias independientes?, explique.
24. Sean X y Y variables aleatorias normal estándar, independientes. Hallar:
a) la distribución conjunta de U = YX y V = |Y |
b) la función densidad de probabilidad de U
c) E(U)
d) ¿Son U y V variables aleatorias independientes?, explique.
25. Si las variables aleatorias X y Y tienen función de densidad de probabilidad conjunta

 emin{x,y} − 1 e−x−y 0 < x < ∞; 0 < y < ∞
fX,Y (x, y) =
0 otras partes

Determinar la función de densidad de probabilidad marginal de X.

26. Sean X y Y variables aleatorias con media 0 y varianza 1. Si el coeficiente de correlación
de X y Y es −0.5, determinar el valor de la varianza de la variable aleatoria Z definida por
Z = X + 4Y
27. Si las variables aleatorias X y Y tienen función masa de probabilidad conjunta uniforme
definida en el conjunto de pares
{(−2, 0), (−1, 0), (1, 0), (2, 0), (0, −2), (0, −1), (0, 1), (0, 2)}
a) Hallar Cov(X,Y )
b) Son X y Y variables aleatorias independientes?
28. Suponga que las variables X y Y son independientes e idénticamente distribuidas. Sea Z =
aX +Y . Si el coeficiente de correlación entre las variables X y Z es 13 , determinar el valor de
la constante a.
29. Sean X y Y variables aleatorias independientes e idénticamente distribuidas, con modelo
común chi-cuadrado con 2 grados de libertad.
a) Determinar la función generadora de momentos de la variable aleatoria 2X + 3Y .
b) Determine, si es posible, la función densidad de probabilidad o la función de distribución
de la variable aleatoria 2X + 3Y . Si no es posible argumente por qué.
30. Sean X y Y variables aleatorias independientes. Si X ∼ Bin(n, p) y Y ∼ Bin(m, p), determinar
la distribución de la variable aleatoria X +Y
común normal estándar. Determinar la distribución de la variable aleatoria 12 (X 2 +Y 2 )
32. Sean X y Y variables aleatorias tales que
1
E[X] = 1; E[Y ] = 2; E[X 2 ] = 2; E[Y 2 ] = 6;Cov(X,Y ) =
2
Hallar los valores de las constantes a y b de manera que la variable aleatoria aX + bY tenga
media 3 y varianza mínima.
33. Una urna contiene 5 bolas blancas y 3 bolas negras. Se toman al azar 2 bolas, sin reemplazo,
de la urna. Si X representa el número de bolas blancas extraídas” y Y “el número de bolas
negras extraídas”, determinar la covarianza de X y Y .
34. Si X representa el número de 1 y Y representa el número de 5 en tres lanzamientos de un dado
legal, determine el coeficiente de correlación de X y Y .
35. Sean X y Y variables aleatorias tales que Var(X) = 4, Var(Y ) = 16 y Cov(X,Y ) = 2, determi-
nar el valor de Var(3Y − 2X)
36. Sean X y Y variables aleatorias tales que
1
ρXY = ; σX2 = a; σY2 = 4a; σZ2 = 114
3
donde Z = 3X − 4Y . Determinar el valor de la constante a.
37. Sea X una variable aleatoria con varianza finita. Si Y = 15 − X, determinar el coeficiente de
correlación entre las variables aleatorias X y (X +Y )X
38. Si la fdp conjunta de X y Y es
(
K −1 < x < 1, x2 < y < 1
fX,Y (x, y) =
0 otro caso
Determinar el valor de E[Y |X = x]

(
10xy2 0 < x < y < 1
fX,Y (x, y) =
0 otro caso
Determinar el valor de E[X 2 |Y = y]

(
2e−2(x+y) 0 < x < y < ∞
fX,Y (x, y) =
0 otro caso
Determinar el valor esperado de Y dado que X = x

41. Si E[Y |X = x] = 2 + 5x, Var(Y |X = x) = 3, y la variable aleatoria X tiene función de densidad
de probabilidad
(
1 − 2x
xe 0<x<∞
fX (x) = 4
0 otro caso
Hallar el valor esperado y la varianza de Y

42. Si E[Y |X = x] = 2x, Var(Y |X = x) = 4x2 + 3, y la variable aleatoria X tiene función de
densidad de probabilidad
2
(
√4 x2 e−x 0≤x<∞
fX (x) = π
0 otro caso
Hallar el valor esperado y la varianza de Y

43. Sean X y Y variables aleatorias con fdp conjunta

(
2 0 < y < 1 − x, 0 < x < 1
fX,Y (x, y) =
0 otro caso
1
Hallar la varianza condicional de Y dado que X = 4
( √
4x 0 < x < y < 1
fX,Y (x, y) =
0 otro caso
Hallar la varianza condicional de Y dado que X = x

(
6x
1 ≤ x + y ≤ 2, x ≥ 0, y ≥ 0
fX,Y (x, y) = y
0 otro caso
3
Hallar la varianza condicional de X dado que Y = 2
(
12x 0 < y < 2x < 1
fX,Y (x, y) =
0 otro caso
Hallar la varianza condicional de Y dado que X = 12

47. Si la función de densidad de probabilidad condicional de Y dado X = x es dada por
(
5 y 5−y si y = 0, 1, 2, 3, 4, 5
y x (1 − x)
fY |x (y|x) =
0 otro caso
y la función de densidad de probabilidad marginal de X es

(
4x3 0 < x < 1
fX (x) =
0 otro caso
Hallar E[Y |X = x]
(
e−x 0 < x < ∞, 0 < y < 1
fX,Y (x, y) =
0 otro caso
Si Z = X + 2Y , determinar la fdp conjunta de las variables X y Z

(
6x
1 ≤ x + y ≤ 2, x ≥ 0, y ≥ 0
fX,Y (x, y) = 7
0 otro caso
Determinar la fdp conjunta de las variables U = 2X + 3Y y V = 4X +Y


(
6x
1 ≤ x + y ≤ 2, x ≥ 0, y ≥ 0
fX,Y (x, y) = 7
0 otro caso
Determinar la fdp de la variable U = YX

( 2
5xy
0<x<y<2
fX,Y (x, y) = 16
0 otro caso
Determinar la fdp conjunta de las variables U = 3X − 2Y y V = X + 2Y
( √
4x 0 < x < y < 1
fX,Y (x, y) =
0 otro caso
Determinar la fdp de la variable U = X −Y
( √
4x 0 < x < y < 1
fX,Y (x, y) =
0 otro caso
Determinar la fdp de la variable U = YX

( √
4x 0 < x < y < 1
fX,Y (x, y) =
0 otro caso
Determinar la fdp de la variable U = XY
55. Sean X ∼ U(0, 2) y Y ∼ U(0, 3), independientes. Determinar la fdp de la variable aleatoria
X +Y
56. Cuál es la función masa de probabilidad de las suma de dos variables aleatorias independientes
e idénticamente distribuidas, con modelo comun binomial con parámetros n y p?
57. Cuál es la función de densidad de probabilidad de las suma de dos variables aleatorias
independientes e idénticamente distribuidas, con modelo comun exponencial con parámetros
β?
58. Cuál es la función masa de probabilidad de las suma de dos variables aleatorias independientes
e idénticamente distribuidas, con modelo comun poisson con parámetro λ
59. Cuál es la función densidad de probabilidad de la variable aleatoria promedio aritmético
de dos variables aleatorias independientes e idénticamente distribuidas, con modelo común
normal con parámetros µ y σ ?
60. La función de distribución conjunta de X y Y es
(
a(3x3 y + 2x2 y2 ) 0 < x < 1, 0 < y < 1
FX,Y (x, y) =
0 otro caso
Hallar el valor de fX,Y ( 21 , 12 )

3(2 − 2x − y)
61. Si fX,Y (x, y) = en la región en el plano acotada por los ejes coordenados y la
2
línea recta y = 2 − 2x, hallar la función de densidad marginal de X
62. Dada la fdp conjunta de X y Y
(
x2 + xy
3 0 < x < 1, 0 < y < 2
fX,Y (x, y) =
0 otro caso
Hallar P(X > 12 |Y > 21 )

(
2 2
(x + y2 ) 0 ≤ x2 + y2 ≤ 1
fX,Y (x, y) = π
0 otro caso
Hallar E(X|Y = 21 )
(
π
sin( πy −x
2 )e 0 < x < ∞, 0 < y < 1
fX,Y (x, y) = 2
0 otro caso
Hallar P(X > 1|Y = 12 )

(
e−(x+y) 0 < x < ∞, 0 < y < ∞
fX,Y (x, y) =
0 otro caso
Hallar P(X > Y |X > 21 )

66. La fdp marginal de X es fX (x) = x + 21 y la fdp condicional de Y dado X = x es

 x+y1 0 < x < 1, 0 < y < 1
fY |x (y|x) = x+ 2
0 otro caso
Hallar la fdp marginal de Y

67. La fdp conjunta de X y Y es
(
1 0 < x < 1, 0 < y < 1
fX,Y (x, y) =
0 otro caso
Hallar P(Y − X > 0|X +Y > 21 )

68. La fdp conjunta de X y Y es
(
xe−x(1+y) 0 ≤ x < ∞, 0 ≤ y < ∞
fX,Y (x, y) =
0 otro caso
Hallar la fdp condicional de Y dado X = x


(
kxy2 0 < x < 1, x2 + 1 < y < 2
fX,Y (x, y) =
0 otro caso
a) Hallar la covarianza de X y Y
b) ¿Son X y Y variables aleatorias independientes? Explique
70. Si X y Y están normalmente distribuidas con fdp conjunta
1 2
e− 6 [(2x−y) +2xy]
fX,Y (x, y) = √
2π 3
Hallar el coeficiente de correlación entre X y Y
(
1
0 ≤ x2 + y2 ≤ 1
fX,Y (x, y) = π
0 otro caso
Hallar fX|y (x|y)

(
x + y 0 ≤ x ≤ 1, 0 ≤ y ≤ 1
fX,Y (x, y) =
0 otro caso
Hallar P(2X ≤ 1|X +Y ≤ 1)

73. Se selecciona al azar un punto del intervalo [0, 1], entonces se selecciona un segundo punto
de manera aleatoria de los puntos que se encuentran entre el primer punto seleccionado y el
número 1. Hallar la probabilidad que la suma de las distancias de cada punto a 0 sea mayor o
igual a 1.
74. Sea X una variable aleatoria binomial con parámetros n y p, Suponga que la variable aleatoria
condicional de Y dado X = x se distribuye poisson con media x. Determinar el valor de la
varianza de Y
(
4xy 0 < x < 1, 0 < y < 1
fX,Y (x, y) =
0 otro caso
Determinar la fdp conjunta de las variables U = X2 y V = Y2

(
8xy 0 < x < 1, 0 < y < 1
fX,Y (x, y) =
0 otro caso
Determinar la fdp conjunta de las variables U = YX y V = Y

X
común exponencial con media 1. Sean U = X +Y y V = X+Y . Hallar la función de densidad
de probabilidad marginal de V .
78. Sean X y Y variables aleatorias independientes, X ∼ gamm(α, β1 ) y Y ∼ gamm(α, β2 ). Sean

X
U = X +Y y V = X+Y .
a) Son U y V variables aleatorias independientes? Explique.
b) Halle, si es posible, la distribución de la variable aleatoria V . Si no es posible determinar
el modelo para V explique por qué.
79. Para variables aleatorias X y Y , independientes e idénticamente distribuidas, muestre que
las variables U = X +Y y V = X −Y son no correlacionadas pero no necesariamente inde-
pendientes. Demuestre que U y V son independientes si X y Y son distribuciones normales
estándar.
80. Covarianza y correlación de eventos
Suponga que A y B son eventos de un experimento aleatorio. La covarianza y correlación
de A y B se define mediante la covarianza y correlación de sus correspondientes variables
indicadoras:
Cov(A, B) := Cov(IA , IB )
donde
(
1 si ω ∈ A
IA (ω) =
0 si ω ∈
/A
Demostrar que
a) Cov(A, B) = P(A ∩ B) − P(A)P(B)
b) Cov(A, Bc ) = −Cov(A, B)
c) Cov(Ac , Bc ) = Cov(A, B)
P(A ∩ B) − P(A)P(B)
d) ρA,B = p
P(A)(1 − P(A))P(B)(1 − P(B))
81. Suponga que (Ω, F , P) es un espacio de probabilidad y que A, B ∈ F . Demostrar que
a) Cov(A,s B) = P(A)(1 − P(B))
P(A)(1 − P(B))
b) ρA,B =
P(B)(1 − P(A))
82. Sean X y Y variables aleatorias independientes e idénticamente distribuidas con modelo
común:
1

 √ para 0 < t ≤ 1
f (t) = 2 t
0 otro caso

Hallar la función de densidad de probabilidad de la variable aleatoria S := X +Y

83. Sean X y Y variables aleatorias independientes e idénticamente distribuidas con fdp común:
(
λ e−λt para t > 0
f (t) =
0 otro caso
Hallar la función de densidad de probabilidad conjunta de las variables aleatorias U := X +Y

y V = eY
84. Sean X y Y variables aleatoria con función de densidad de probabilidad conjunta

2 −4xy+4y2 )
fX,Y (x, y) = ce−(2x
A) Hallar E[X], E[Y ].

B) Hallar el coeficiente de correlación de X y Y .
C) Hallar Var(X) y Var(Y ).
D) Determinar si X y Y son variables aleatorias independientes.
85. Sean X y Y variables aleatoria con función de densidad de probabilidad conjunta
x2 y2
fX,Y (x, y) = ce− 8 − 18
A) Hallar E[Y |X = t].

B) Determine si existe o no
lı́m E[Y |X = t]
t→∞
C) Hallar el coeficiente de correlación de X y Y .

D) Determinar si X y Y son variables aleatorias independientes.
E) Hallar Var(X|Y ).
86. Sean X y Y variables aleatorias con función de densidad de probabilidad conjunta:
(
4xy para 0 < x < 1, 0 < y < 1
f (t) =
0 otro caso
Sean U := YX y V := XY .
a) Hallar la fdp conjunta de U y V .
b) Hallar las fdp marginales de U y V .
c) Son U y V independientes?
87. Dado que X = x, Y es condicionalmente uniforme en el intervalo [x − π, x + π]. Utilice la ley
de probabilidades totales para calcular
E[cos(X +Y )]
88. Utilice la ley de probabilidades totales para calcular
P[Y > y]
sí X ∼ U[1, 2], y dado que X = x, Y es condicionalmente exponencial con parámetro x.

89. Utilice la ley de probabilidades totales para calcular
E[XeY ]
sí X ∼ U[3, 7], y dado que X = x, Y es condicionalmente normal con media 0 y varianza x2

90. Una gallina pone n huevos. Cada huevo nace (da origen al nacimiento de un polluelo) o no
independientemente, con probabilidad p de nacimiento. Por cada huevo que nace, el polluelo
sobrevive o no (independientemente de los otros huevos), con probabilidades de supervivencia
s. Sea N ∼ Bin(n, p) el número de huevos que nace, X es el número de pollitos que sobreviven,
y Y el número de polluelos que nacen pero no sobreviven, entonces X +Y = N.
a) Hallar la fmp conjunta de X y Y

b) Hallar la fmp marginal de X
c) ¿Sopn independientes las variables X y Y ? Explique.
91. Sea X ∼ U(1, 5) Dado X = x, sea Y la variable aleatoria “punto seleccionado aleatoriamente
entre 1 y x”. Hallar
a) La fdp de la variable aleatoria Y .
b) La varianza de Y .
c) ¿Son X y Y variables aleatorias independientes? Explique.
92. El número de vehículos particulares que salen por el peaje de los Andes un día sábado
cualquiera, entre las 6 a.m. y las 7 a.m. se distribuye poisson con un promedio de 240
vehículos por hora. El número de pasajeros en cada vehículo se distribuye uniforme entre 1
y 5 pasajeros. El número de vehículos que salen por el peaje y el número de pasajeros por
vehículo son variables aleatorias independientes.
a) Determine el número esperado de personas que salen en automóvil particular, por el
peaje de los Andes, un sábado cualquiera entre las 6 a.m. y las 6 : 15 a.m..
b) Determine la desviación estándar del número de personas que salen en automóvil
particular, por el peaje de los Andes, un sábado cualquiera entre las 6 a.m. y las 6 : 15
a.m..
93. Se lanza un dado legal, y luego se lanza una moneda, con probabilidad p de salir cara, tantas
veces como sale en el lanzamiento del dado (por ejemplo, si el lanzamiento del dado resulta
en 2 entonces la moneda se lanza dos veces). Sea X el resultado de la tirada del dado y Y es el
número de veces que la moneda cae cara.
a) Hallar la función masa de probabilidad del número de caras que aparece si se sabe que
en el dado salió el número j.
b) Hallar la fmp conjunta de X y Y .
c) ¿Cuál es el número de caras que se espera obtener?
94. Suponga que la probabilidad de que aparezca una cara cuando se lanza una moneda es p y
la probabilidad de que ocurra un sello es q = 1 − p. Camila lanza la moneda hasta que la
primera cara sale y se detiene; Santiago hace lo mismo. Los resultados obtenidos por Camila y
Santiago se supone son independientes. ¿Cuál es la probabilidad de que Camila y Santiago
detengan sus lanzamientos exactamente en el mismo número de lanzamientos?
95. Se tienen dos piezas de alambre, una de longitud L1 y la otra de longitud L2 ; en cada pieza se
selecciona un punto al azar de manera uniforme e independiente. De las cuatro piezas resultan-
tes se seleccionan tres al azar. ¿Cuál es la probabilidad que con las tres piezas seleccionadas
se pueda construir un triángulo no degenerado?
en este capitulo extendermos la teoria de los modelos bivariados a un conjunto finito de más de dos
de variables aleatorias.
Transformación de una variable aleatoria
Transformación de dos variables aleatorias
7 — Transformación de variables aleatorias
Uno de los objetos de estudio de la estadística es analizar e interpretar datos. Regularmente un

estudio estadístico inicia con plantearse un problema, una pregunta, plantearse unas hipótesis y
definir un modelo de investigación. Algunos pasos posibles son los siguientes:
X Formular la pregunta orientadora de la investigación o establecer el problema que se pretende
resolver.
X Diseñar un modelo de experimento o estudio para la recopilación de información.
X Recopilar la información.
X Hacer un análisis exploratorio de los datos.
X Interpretar la información.
X Poner a prueba las hipótesis del problema.
X Hacer inferencias estadísticas, para explicar o tomar decisiones del problema estudiado.
X Analizar el modelo de investigación, a la luz de los resultados obtenido, para calibrarlo si
fuera necesario.
En la etapa de planteamiento estadístico el modelo formulado contendrá algunos parámetros que
deberán estimarse con los datos, se establecen algunas funciones de los datos (estadísticos) y en
muchos casos es necesario transformar estos datos para analizarlos. En este capitulo estudiaremos
las herramientas de probabilidad para estas transformaciones; consideraremos dos métodos: función
distribución y cambio de variables.
7.1
Algunas situaciones donde es necesario considerar transformaciones de variables aleatorias.

a) La variable H da la estatura en centímetros de un individuo, para efectos de comparación
con otra población debemos expresar su unidad de medida en pulgadas, entonces
H
consideramos la variable aleatoria Y = 2.54
b) La variable T representa la temperatura, medida en grados celsius de una persona
162 Transformación de variables aleatorias
haciendo ejercicio en bicicleta, un procedimiento de análisis requiere que estas medidas

estén expresadas en grados fahrenheit. La nueva variable aleatoria a considerar es
Y = 1.8T + 32
c) Un objeto se mueve en un plano bajo la acción de diferentes fuerzas, que se manifiestan
en forma aleatoria; la distancia recorrida es una variable aleatoria D y la fuerza aplicada
es otra variable aleatoria F, por tanto la variable aleatoria W , definida por W = FD
representará el trabajo aleatorio que se realizará sobre este objeto.
d) En una población el indice de masa corporal es una variable aleatoria construida como
la razón entre las variables aleatorias P peso del individuo y H 2 , siendo H la estatura
del individuo.
e) Dados los recorridos de un automóvil, digamos j = 1, 2, . . . , m; al medir la distancia de
D
cada recorrido D j y los galones de combustibles gastados G j , entonces la variable
G
distancia recorrida por litro da información de la eficiencia en uso de combustible del
vehículo.
f) En una economía inestable el indice de precios al consumidor, IPC, puede asumirse
como una variable aleatoria. El IPC es definido como el costo, en un momento dado en
el tiempo, de una canasta estándar de bienes de consumo. Si los precios de los bienes
de consumo que constituyen la canasta, fluctúan por efectos del mercado, entonces el
IPC es una suma ponderada de estas variables (precios).
7.1 Transformación de una variable aleatoria
En esta sección hallaremos la función de probabilidad de una variable aleatoria que ha sido construida
o definida a partir de otra variable aleatoria.
7.2
Sea X una variable aleatoria con fdp fX , y consideremos la variable aleatoria Y = 2x − 3 que
es una transformación afín de los valores de la variable aleatoria X. Estableceremos la función
de distribución de Y y la fdp de Y
a) Función de distribución de Y :
FY (y) = P(Y ≤ y)
= P(2X − 3 ≤ y)
y+3
= P(X ≤ )
2
y+3
= FX ( )
2
b) Función densidad de probabilidad de Y :
dFY
fY (y) = (y)
dy

d y+3
= FX ( )
dy 2

y+3 1
= fX ·
2 2
7.3
Sea X una variable aleatoria con fdp fX , y consideremos la variable aleatoria Y = −2x + 1
que es una transformación afín de los valores de la variable aleatoria X. Estableceremos la
función de distribución de Y y la fdp de Y
a) Función de distribución de Y :
FY (y) = P(Y ≤ y)
= P(−2X + 1 ≤ y)
= P(−2X ≤ y − 1)
y+1
= P(X ≥ )
−2
y+1
= 1 − P(X ≤ − )
2
y+1
= 1 − FX (− )
2
dFY
fY (y) = (y)
dy

d y+1
= 1 − FX (− )
dy 2
y+1 1
= − fX (− ) · (− )
2 2
y+1 1
= fX (− )·
2 2
Proposición 7.1
Sea X una variable aleatoria con fdp fX , Y = aX + b una nueva variable aleatoria, entonces
dFY
fY (y) = (y)
dy
(
1 y−b
a fX ( a ) si a > 0
=
− 1a fX ( y−b
a ) si a < 0

1 y−b
= fX
|a| a
7.4
Sea X una variable aleatoria con fdp f , Y = e2X una nueva variable aleatoria. Determinar la
función de distribución y la función densidad de probabilidad de Y .
a) Función distribución de probabilidades de Y :
fY (y) = P(Y ≤ y)
= P(e2X ≤ y)
= P(ln(e2X ) ≤ ln(y)) siempre que tenga sentido ln(y)
= P(2X ≤ ln(y))
ln y
= P(X ≤ )
2

ln y
= FX
2
dFY
fY (y) = (y)
dy
dFX ( ln2y )
=
dy

ln y 1
= fX ·
2 2y
7.5
1
Sea X una variable aleatoria con fdp f , Y = √ una nueva variable aleatoria. Determinar la
X
función de distribución y la función densidad de probabilidad de Y .
a) Función distribución de probabilidades de Y :
fY (y) = P(Y ≤ y)
1
= P( √ ≤ y)
X
√ 1
= P( X ≥ ) para y 6= 0
y
1
= P(X ≥ 2 ) porque X > 0
y
1
= 1 − P(X ≤ 2 )
y

1
= 1 − FX 2
y
dFY
fY (y) = (y)
dy
dFX ( y12 )
=−
dy

1 2
= − fX 2 · − 3
y y

2 1
= 3 · fX 2
y y
Proposición 7.2
Sea X una variable aleatoria de tipo continuo y g : R −→ R una función diferenciable,
estrictamente monótona. La nueva variable aleatoria Y = g(X) tiene función densidad de
probabilidad:
 −1
 f (g−1 (y)) · dg (y) si

X dy
fY (y) =

0 otro caso
En efecto
I ) Caso 1: g es monótona creciente.
FY (y) = P(Y ≤ y)
= P(g(X) ≤ y)
= P(X ≤ g−1 (y)) porque g es monótona creciente
−1
= FX (g (y))
Por tanto
dFY dg−1 (y)

fY (y) = (y) = fX (g−1 (y)) ·
dy dy
II ) Caso 2: g es monótona decreciente.
FY (y) = P(Y ≤ y)
= P(g(X) ≤ y)
= P(X ≥ g−1 (y)) porque g es monótona decreciente
−1
= 1 − P(X ≤ g (y))
= 1 − FX (g−1 (y))
Por tanto
dFY dg−1 (y)

fY (y) = (y) = − fX (g−1 (y)) ·
dy dy
En resumen
 −1
 f (g−1 (y)) · dg (y) si

X dy
fY (y) =

0 otro caso
7.6
Sea X ∼ U([0, π]) y Y = sin(X). Hallar las funciones de distribución y densidad de probabili-
dad de Y
La función seno no es completamente creciente o decreciente en [0, π]. La inversa principal de seno
está definida en el intervalo [− π2 , π2 ] y se denota arc sen.
Respecto de la variable aleatoria Y su soporte es el intervalo [0, 1], entonces dado y ∈ [0, 1) existen
dos puntos x1 ∈ [0, π2 ] y x2 ∈ [ π2 , π] tales que y = sin(x1 ) = sin(x2 ), como observamos en la siguiente
ilustración
Ahora bien, es claro que x1 = arc sen(y), mientras que x2 = π − arcsin(y). Calculemos ahora la
función de distribución de probabilidad de Y :
FY (y) = P(Y ≤ y)
= P(0 ≤ Y ≤ y)

= P (0 ≤ X ≤ arcsin(y)) ∪ (π − arcsin(y) ≤ X ≤ π)
arcsin(y) + (π − (π − arcsin(y)))
= · I[0,1) (y) + I[1,∞) (y)
π
2 arcsin(y)
= I[0,1) (y) + I[1,∞) (y)
π
por tanto la función densidad de probabilidad de Y es:
2


 p si 0 ≤ y < 1
 π 1 − y2

fY (y) =

 δ (1) si y ≥ 1

0 otro caso

Teorema 7.1
Sea X una variable aleatoria continua con soporte RX , y sea Y = g(X). Si existe una partición
de RX , RX = R1 ∪ R2 ∪ . . . ∪ Rm , tal que g es estrictamente monótona y diferenciable en cada
Ri , entonces la función densidad de probabilidad de Y está dada por

 −1
 m f (g−1 (y)) · dgi (y) si y ∈ Y

∑i=1 X i dy
fY (y) =

 0 otro caso
donde Y := {y ∈ R : y = gi (x), para algún x ∈ Ri }, con gi = g|Ri la restricción de g a Ri .
7.7
Sea X ∼ U([−π, π]). Hallar la distribución de Y = cos X
Sea X una variable aleatoria con fmp o fdp f , y sea Y = g(X) una nueva variable aleatoria.
7.8
Sea X ∼ U([−π, π]). Hallar la distribución de Y = cos X
La fdp de X es
(
1
2π si x ∈ [−π, π]
fX (x) =
0 otro caso
I) Método directo:
Como Y ∈ [−1, 1] y la función cos(x) es creciente en [−π, 0] y decreciente en [0, π] entonces
abrimos el problema en dos partes:
dx −1
• y ∈ [−π, 0], entonces y = cos x implica x = π − cos−1 y, luego = −p =
dy 1 − y2
1
p .
1 − y2
dx 1
• y ∈ [0, π], entonces y = cos x implica x = cos−1 y, luego = −p .
dy 1 − y2
En consecuencia:

−1
dx
fY (y) = ∑ fX (cos (y))
cos x=y dy
por tanto
1 2


 ·p si cos−1 y ∈ [0, π]
 2π

1 − y2
fY (y) =



0 otro caso

En resumen
1 1


 ·p si y ∈ [−1, 1]
π 1 − y2

fY (y) =



0 otro caso

II ) Método de la función acumulativa:


0

 si x < −π
FX (x) = x+π
2π si − π ≤ x < π

si x ≥ π

1
Los eventos equivalentes al evento {Y ≤ y} son {X < − cos−1 y} y {X > cos−1 y}; luego la
FD de Y está dada por
FY (y) = P(Y ≤ y) = P(cos X ≤ y)
es decir

0

 si y < −1
FY (y) = P(X ≤ − cos−1 y) + P(X ≥ cos−1 y) si − 1 ≤ y ≤ 1


1 si y > 1

0

 si y < −1
cos−1 y
FY (y) = 1− π si − 1 ≤ y ≤ 1


1 si y > 1
asumiendo que cos−1 y > 0.

Por tanto
1 1


 ·p si y ∈ [−1, 1]
π 1 − y2

fY (y) =



0 otro caso

7.9
Rectificador de onda completa. Sea X ∼ U([−1, 1]). Hallar la distribución de la variable

aleatoria Y = Xu(X), donde u es la función escalón unitario.
La función densidad de probabilidad de X es

(
1
x ∈ [−1, 1]
fX (x) = 2
0 otros casos
El soporte de la variable aleatoria Y es [0, 1]. Calculemos FY (y).
X Si y < 0 entonces el evento {Y ≤ y} es 0,

/ por tanto P(Y ≤ y) = 0
X Si y = 0, entonces {Y ≤ 0} = {X = 0}, por tanto P(Y ≤ 0) = P(X = 0) = FX (0+ )−FX (0− ) = 0
X Si y > 0, entonces {Y ≤ y} = {XU(X) ≤ y} = {X ≤ y|X > 0}, por tanto
y+1
P(0 < X ≤ y) 2
P(Y ≤ y) = P(X ≤ y|X > 0) = = 1
= y+1
P(X > 0) 2
En resumen:
(
0 si y ≤ 0
FY (y) =
y+1 si 0 < y ≤ 1
en consecuencia la función densidad de probabilidad de Y es:
(
1 si 0 < y ≤ 1
fY (y) =
0 otro caso
7.2 Transformación de dos variables aleatorias
Empezaremos con algunos ejemplos con el método de la función distribución.
Función distribución
7.10
Sean X ∼ exp(α) y Y ∼ exp(α), variables aleatoria independientes e idénticamente distribui-

das. Determinar la función distribución y la función densidad de probabilidad de la variable
aleatoria X +Y
Como X ∼ exp(α) y Y ∼ exp(α) entonces fX (x) = αe−αx , para x ≥ 0, y fY (y) = αe−αy para y ≥ 0,
respectivamente; por tanto la función densidad de probabilidad conjunta de X y Y , por independencia,
es
(
α 2 e−α(x+y) si x ≥ 0, y ≥ 0
fX,Y (x, y) =
0 otro caso
7.2 Transformación de dos variables aleatorias 171
sea z ≥ 0, entonces
P(Z ≤ z) = P(X +Y ≤ z)
Z z Z z−x
= α 2 e−α(x+y) dydx
0 0
Z z Z z−x
= αe−αx αe−αy dy dx
0 0
Z z z−x
−αx −αy

= αe −e dx
0 0
Z z
−αx −α(z−x)
= αe 1−e dx
0
Z z
−αx −αz
= αe − αe dx
0
Z z Z z
−αx −αz
= dx − αe
αe dx
0 0
z
= −e−αx − zαe−αz

0
= 1 − e−αz − zαe−αz
(
1 − e−αz − zαe−αz si z ≥ 0
P(Z ≤ z) =
0 si z < 0
Por tanto la función densidad de probabilidad de Z = X +Y es:

(
zα 2 e−αz si z ≥ 0
fZ (z) =
0 si z < 0

Probabilidad Estadistica

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Probabilidad Estadistica

Cargado por

Copyright:

Formatos disponibles

PROBABILIDAD

introducción a la inferencia estadística

Photos by: Paola alejandra Moreno. Laguna de Tota, Boyacá, Colombia.

Primera edición, mayo 2021

1 Espacios muestrales y eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

5 Modelos continuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

6 Modelos aleatorios bivariados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

7 Transformación de variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . 161

1 — Espacios muestrales y eventos

1.1 Elementos de conjuntos

El símbolo ‘∈’ es el de pertenencia y se lee pertenece, por ejemplo u ∈ V , donde V es el conjunto de

N Sea Ω el conjunto referencial y A un conjunto definido en Ω.

• Si x es un elemento de A, entonces escribiremos x ∈ A.

Dos conjuntos son comparables mediante la relación de contenencia.

Sea D = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, el conjunto de los dígitos. Los conjuntos P = {0, 2, 4, 6, 8}

• El conjunto constituido por los elementos que pertenecen al conjunto A o al conjunto B,

Es posible definir otras operaciones entre conjuntos, como la intersección y la unión.

• El conjunto diferencia de Ω con A, Ω − A se llama el complemento de A y se simboliza

• El producto cartesiano de los conjuntos A y B es un subconjunto del espacio referencial

e) f (A − B) ⊇ f (A) − f (B), para todo A, B ⊆ X, si y solamente si f es inyectiva.

N Intuitivamente la cardinalidad de un conjunto corresponde al número de elementos que éste

N Dado n ∈ N, n ≥ 1, denotamos con Zn el conjunto {1, 2, 3, . . . , n}

a) El conjunto de los números enteros positivos pares, A, es enumerable.

definida por f (n) = 2n es una función biyectiva.

definida por f (n) = 2n − 1 es una función biyectiva.

a) El conjunto de los números racionales Q es contable.

La propiedad d) se puede generalizar de la siguiente manera, su demostración es mediante inducción

Proposición 1.3 Principio de inclusión-exclusión

se llama clase de equivalencia de representante a.

N El conjunto de todas las clases de equivalencia de R sobre A, se llama cociente o conjunto

1.2 Técnicas de Conteo

1.2.1 Principios fundamentales

Proposición 1.5 Principio de adición

|A| = |A1 | + |A2 | + . . . + |An |

La colección finita {A1 , A2 , . . . , An } se llama una partición finita de A.

Proposición 1.6 Principio de adición

Otro principio es el de multiplicación.

Proposición 1.7 Principio de multiplicación

|A| = |B1 | · |B2 | · |B3 | . . . |Bn |

Otra manera de presentar el Principio de Multiplicación es la siguiente:

resultados compuestos distintos.

a) Del conjunto de los números enteros positivos de 1 a 1000, se selecciona al azar un

diferentes podemos formar?

|A| = 100, |B| = 100

Como C = A ∪ B y A ∩ B = 0/ por tanto

|C| = |A| + |B| = 200

b) Tenemos varios casos:

Pareja Número de resultados diferentes Total

c) Similar al problema anterior

Pareja Número de resultados diferentes Total

Muestreo con reemplazo y con orden

Observemos que en este caso, es posible tener m ≥ n.

Muestreo sin reemplazo y con orden

b) El número de cadenas de ADN de longitud 4, sin repetición de nucleótidos, es:

Observemos que si m = n entonces (n − m)! = 0! = 1 y por tanto n pn = n!.

Muestreo sin reemplazo y sin orden

Consideremos el conjunto A = {a, e, i, o, u}. Cuántos subconjuntos de A con dos elementos

Proposición 1.10 Combinaciones

X El número total de opciones con cualquiera de los ingredientes, y cualquier tamaño es

Muestras con reemplazo y sin orden

Observemos que sacar la muestra 3, 1, 3, 2 es la misma que extraer 3, 2, 1, 3. Solamente necesitamos

Permutaciones con elementos indistinguibles

a) Dadas las tres letras diferentes A, B,C existen 3! = 6 permutaciones: