Documentos de Académico
Documentos de Profesional
Documentos de Cultura
R
∑
PROBABILIDAD
Introducción inferencia estadística
JAVERGRAF
Pontificia Universidad Javeriana
(https://ciencias.javeriana.edu.co/departamentos-instituto/matematicas).
JAVERGRAF
Derechos reservados © 2021 Ediciones Universidad Javeriana
https://www.javeriana.edu.co/puj/viceadm/dsu/javegraf/
Licencia Creative Commons Reconocimiento - No Comercial 3.0 Unported Licence (la “Licencia”).
Usted puede utilizar este archivo de conformidad con la Licencia. Usted puede obtener una copia de
la Licencia en http://creativecommons.org/licenses/by-nc/3.0. A menos que lo requiera
la ley aplicable o se acuerde por escrito, el software distribuido bajo la Licencia se distribuye “tal y
como está”, sin garantías ni condiciones de ningún tipo, ya sea expresa o implícita.
2 Espacio de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.1 Espacios medibles 23
2.1.1 σ − Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2 Espacio de Probabilidad 27
2.3 Probabilidad condicional e independencia 36
2.4 Probabilidades totales y regla de Bayes 43
2.5 Independencia 48
3 Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.1 Distribución de variables aleatorias 53
3.2 Medidas estadísticas de resumen 60
4 Modelos discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.1 Modelo uniforme discreto 65
4.2 Modelo Bernoulli 67
4.3 Modelos binomial 68
4.4 Modelo geométrico 75
4.5 Modelo binomial negativo 81
4.6 MODELO HIPERGEOMÉTRICO 87
4.7 MODELO POISSON 95
Definición 1.1
Un conjunto es una colección bien definida de objetos. Por bien definida entendemos que es
posible determinar con precisión si un elemento pertenece o no al conjunto.
Si un objeto hace parte de un conjunto diremos que es un elemento de este conjunto.
N Existen dos maneras de representar un conjunto: listando todos y cada uno de los elementos
del conjunto o bien describiendo de manera precisa la propiedad que define el ser elemento de
este conjunto. El primer método se denomina extensión y el segundo comprensión.
1.1
Consideremos el conjunto A de todas las vocales del alfabeto en español; éste conjunto puede
definirse por:
X Extensión: {a, e, i, o, u}
X O bien por comprensión: V = {x ∈ Ω : x es una vocal}
siendo Ω la colección de todas las letras que componen el alfabeto español.
Definición 1.2
Sean A y B dos conjuntos del conjunto referencial Ω.
a) A es un subconjunto de B, A ⊆ B, cuando cada elemento de A también es un elemento
de B.
b) A y B son iguales, A = B, si y solamente si A ⊆ B y B ⊆ A.
N
X El conjunto que no tiene elementos se llama conjunto vacio, se denota con 0.
/
X 0/ es subconjunto de cualquier conjunto.
1.2
Definición 1.3
Sean A y B dos conjuntos del conjunto referencial Ω.
• El conjunto constituido por los elementos que pertenecen tanto al conjunto A como al
conjunto B se llama el conjunto intersección de A con B y se simboliza A ∩ B, es decir
A ∩ B = {x ∈ Ω : x ∈ A y x ∈ B}
A ∪ B = {x ∈ Ω : x ∈ A o x ∈ B}
Definición 1.4
Los eventos A y B son mutuamente excluyentes, disyuntos o ajenos sí A ∩ B = 0/
N ˙
Cuando los conjuntos A y B son disyuntos, la unión de estos se escribirá A + B o bien A∪B
Definición 1.5
Sean A y B conjuntos de un conjunto referencial Ω.
• El conjunto constituido por todos los elementos de A que no están en el conjunto B es
el conjunto diferencia de A con B, A − B, y se define formalmente por:
A − B = {x ∈ Ω : x ∈ A, x ∈
/ B}
Ac = {x ∈ Ω : x ∈
/ A}
A × B := {(x, y) ∈ Ω × Ω : x ∈ A, y ∈ B}
Definición 1.6
Sea f : X −→ Y , una función entre los conjuntos X y Y . Sean A ⊆ X, B ⊆ Y .
a) El conjunto f (A) := { f (a) : a ∈ A} es la imagen directa, o imagen, de A bajo f .
b) El conjunto f −1 (B) := {x ∈ X : f (x) ∈ B} es la imagen inversa de B bajo f .
1.3
a) Si f (x) = x2 entonces
X f ([0, 3]) = [0, 9]
X f ([−1, 3]) = [0, 9]
X f −1 ({4}) = {−2, 2}
X f −1 ([0, +∞)) = R
b) Si f (x) = sin x entonces
X f ({nπ : n ∈ Z}) = {0}
X f ({nπ + π2 : n ∈ Z}) = {−1, 1}
X f −1 ([0, 1]) = n∈Z [2nπ, (2n + 1)π]
S
En la proposición siguiente, resumimos algunas de las propiedades más relevantes de las imagenes
directas e inversas bajo una función con las operaciones de unión, intersección y diferencia.
Proposición 1.1
Sea f : X −→ Y , una función.
a) f (A ∪ B) = f (A) ∪ f (B), para todo A, B ⊆ X.
b) f (A ∩ B) ⊆ f (A) ∩ f (B), para todo A, B ⊆ X.
c) f (A ∩ B) = f (A) ∩ f (B), para todo A, B ⊆ X, si y solamente si f es inyectiva.
d) f (A − B) ⊇ f (A) − f (B), para todo A, B ⊆ X.
10 Espacios muestrales y eventos
Definición 1.7
La cardinalidad del conjunto vacío, 0,
/ es 0.
Definición 1.8
Sean A y B dos conjuntos no vacíos. A y B tienen la misma cardinalidad si y solamente si
existe una aplicación biyectiva entre A y B.
Definición 1.9
Sea A un conjunto. El conjunto A es finito si y solamente si A = 0/ o bien existe una función
biyectiva entre A y Zn para algún n ∈ N, n ≥ 1. En este caso diremos que A tiene n elementos,
y denotaremos #(A) al número de elementos de A, en particular #(0) / := 0.
Definición 1.10
Un conjunto A es enumerable si y solamente si existe una aplicación biyectiva entre Z+ y A.
1.4
f : Z+ −→ A
f : Z+ −→ A
f : Z+ −→ A
1.1 Elementos de conjuntos 11
definida por (
n
2 si n es par
f (n) =
− n−1
2 si n es impar
es una función biyectiva.
Definición 1.11
Un conjunto es contable si y solamente si A es finito o infinito enumerable.
1.5
Proposición 1.2
Sean A y B dos subconjuntos finitos del conjunto referencial Ω, entonces
a) |0|
/ =0
b) Si A ⊆ B, entonces |A| ≤ |B|
c) Si A y B son disyuntos, entonces |A ∪ B| = |A| + |B|
d) |A ∪ B| = |A| + |B| − |A ∩ B|
Definición 1.12
Una relación de equivalenciasobre un conjunto A es una relación R sobre A (es decir, R ⊆ A×A)
que satisface
a) R es reflexiva: aRa, para todo a ∈ A.
b) R es simétrica: si aRb entonces bRa, para todo a, b ∈ A.
c) R es transitiva: si aRb y bRc entonces aRc, para todo a, b, c ∈ A.
12 Espacios muestrales y eventos
Definición 1.13
Si R es unarelación de equivalencia sobre A, entonces el conjunto
[a] := {x ∈ A : xRa}
Proposición 1.4
El conjunto cociente A/R es una partición de A, es decir satisface:
1. Para todo x ∈ A, [x] 6= 0/
2. Si [x], [y] ∈ A/R entonces [x] = [y] o bien [x] ∩ [y] = 0/
3. [˙
A= [x]
[x]∈A/R
r1 + r2 + . . . + rn
Proposición 1.8
Sea un procedimiento que se puede dividir en n etapas sucesivas (ordenadas). Y consideremos
los siguientes supuestos:
I ) Se dan r1 resultados en la primera etapa, r2 resultados en la segunda etapa, . . ., rn
resultados en la última etapa,
II ) El número de resultados en cada etapa es independiente de las selecciones en las etapas
previas,
III ) Los resultados compuestos para dar lugar al procedimiento son todos distintos,
entonces el procedimiento total tiene
r1 × r2 × . . . × rn
1.6
a) Sea C el conjunto de números enteros de 1 a 1000 que son divisibles entre 5. Los números
divisibles entre 5 son los que terminan en 0 y los que terminan en 5. Denotemos con A el
conjunto de los números entre 1 y 1000 que terminan en 0 y con B el conjunto de los números
enteros de 1 a 1000 que terminan en 5, podemos verificar que:
entonces aplicando el principio de adición tenemos que que el número total de resultados para
escoger un par de participantes de diferentes nacionalidades es:
600 + 450 + 750 + 300 + 300 + 500 + 200 + 375 + 150 + 250 = 3875
Por tanto, por el principio de adición, el número total de selecciones de dos libros diferentes
de un par de estos exámenes es: 30 + 20 + 24 = 74.
d) Sea B1 el conjunto de todos los resultados posibles para escoger quien desempeñará el cargo de
presidente, entonces |B1 | = 30, sea B2 el conjunto de todos los resultados posibles para escoger
quien desempeñará el cargo de secretario, entonces |B2 | = 29 ya que debemos descontar a
quien fue seleccionado para presidente, finalmente si B3 es el conjunto de todos los resultados
posibles de selección para tesorero entonces |B3 | = 28 y por el principio de multiplicación el
número total de diferentes comités que se pueden constituir es 30 × 29 × 28 = 24360
1.2.2 Muestras
En las técnicas de conteo se emplea un vocabulario propio de la estadística, población refiriéndose al
conjunto objetivo de estudio (que corresponde al conjunto referencial), y muestra que corresponde a
un subconjunto de la población cuyos elementos tienen la característica de nuestro interés para medir
o contar. Cuando se toma una muestra de la población se dice que se está muestreando la población.
Modelo de la urna: imaginemos una urna, caja cerrada que no permite ver hacia su interior
pero que tiene en la parte superior la manera de sacar los elementos depositados en ella, que
contiene n pelotas marcadas con los números del 1 al n, del mismo tamaño, forma, material,
etc., solo distinguibles por el número colocado en ellas.
Existen cuatro maneras, que se expondrán a continuación, en que las pelotas pueden sacarse
de la urna.
m
n| × n ×
{z. . . × n} = n
m veces
1.7
Un quiz consta de cinco preguntas de verdadero o falso, por tanto existen dos manera de
responder la primera pregunta, dos maneras para responder la segunda preguntas, etc., dos
maneras para responder la quinta pregunta; por tanto el número total de formas en que el quiz
puede contestarse es:
2 × 2 × 2 × 2 × 2 = 25 = 32
1.8
Un jugador de baloncesto practica su tiro libre. Cada lanzamiento da lugar a dos resultados
posibles: encesta, 1, no encesta, 0. Si el jugador hace 10 lanzamientos, de ¿cuántas maneras
puede darse el resultado total de lanzamientos?
210
n!
n × (n − 1) × (n − 2) × . . . × (n − m − 1) = ≡ n pm
(n − m)!
1.9
Un profesor tiene 10 proyectos diferentes para asignar a 6 grupos, cada grupo deberá desarro-
llar un proyecto diferente al proyecto de los otros grupos. ¿De cuántas maneras posibles se
pueden asignar los proyectos a estos grupos?
10!
10 × 9 × 8 × 7 × 6 × 5 = = 151200
4!
Definición 1.14
Un arreglo de objetos, también llamado una sucesión ordenada de objetos, se llama una
permutación de los objetos.
1.2 Técnicas de Conteo 17
Una sucesión ordenada de n objetos se llama una n-permutación; con n objetos diferentes, existen
n! permutaciones posibles, que corresponde al número de maneras diferentes en que los n objetos
distintos se pueden ordenar.
1.10
La pieza básica de los ácidos nucleicos son los nucleotidos. El ADN (ácido desoxirribonu-
cleico) es formado por largas cadenas de nucleótidos. Las bases utilizadas en el ADN son la
adenina (A), citosina (C), guanina (G) y timina (T).
a) El número de cadenas de ADN de longitud 4 es:
4 × 4 × 4 × 4 = 44 = 256
4 × 3 × 2 × 1 = 4! = 24
Proposición 1.9
Si se tienen n objetos distintos, entonces el número de permutaciones de tamaño m que se
pueden formar es:
n!
n pm :=
(n − m)!
1.11
Escribamos en forma extensiva todos los subconjuntos de A que tengan dos elementos:
{a, e}, {a, i}, {a, o}, {a, u}, {e, i}, {e, o}, {e, u}, {i, o}, {i, u}, {o, u},
18 Espacios muestrales y eventos
Observemos que de cada subconjunto podemos sacar 2 permutaciones, por ejemplo del conjunto
{a, e} podemos formar las permutaciones de tamaño 2: ae, ea, por tanto el número de muestras de
tamaño 2 donde no importa el orden multiplicado por el factorial del tamaño de cada muestra nos da
el número total de permutaciones de tamaño 2 tomadas de un conjunto de cardinal 5.
En general si nCk denota el número total de muestras de tamaño k, sin que el orden de los elementos
de estas muestras importe, tomadas de un conjunto de tamaño n entonces:
n pk n! n
k!nCk =n pk =⇒n Ck = = =
k! k!(n − k)! k
1.12
Una pizzeria ofrece su producto con 10 opciones, cada una de las cuales trae 2, 3, o 4
ingredientes; y los tamaños que maneja son personal, mediana, grande y extragrande.
X El número total de opciones con tres ingredientes, sin tener en cuenta el tamaño, es:
10 10!
= = 120
3 3!7!
Proposición 1.11
El número total de m pelotas que pueden ser extraídas, sin orden y con devolución, de un urna
con n pelotas, es:
n+m−1
m
1.2 Técnicas de Conteo 19
||XX|||XXXX
representa la muestra 3, 3, 6, 6, 6, 6.
En general, si existen n pelotas en la urna y se toma una muestra con repetición y no ordenada de
tamaño m entonces en la nueva representación tendremos m marcas X y n − 1 lineas |, por tanto el
número de maneras distintas para seleccionar m posiciones de (n − 1) + m posiciones es
n+m−1
m
1.13
Ocho personas se suben a un elevador inteligente de una torre hospitalaria de diez pisos. El
elevador, al ascender solo se detiene en los números impares, después del primer piso. El
elevador cuenta con un sensor que registra el número de personas que se baja en cada piso,
¿cuántas posibilidades diferentes existen?
En este caso n = 4, pisos impares del 3 al 10, que hacen el papel de las pelotas en la urna; y m = 8,
el número de usuarios que subió al elevador, que corresponden a las pelotas de la muestra. Entonces
el número de maneras en que pueden ocurrir las bajadas del elevador es:
4+8−1 11
= = 165
8 8
En la siguiente sección abordaremos uno caso especial donde algunos de los elementos que constitu-
yen la población son indistinguibles.
20 Espacios muestrales y eventos
1.14
Puesto que la letra O aparece dos veces, el número 3! deberá ser dividido por 2! para
3!
obtener el número de arreglos ordenados distintos: =3
2!
c) Consideremos la palabra MATEMATICA, que contiene la letra M dos veces, T dos
veces y la letra A tres veces. Entonces el número de arreglos ordenados distintos que se
pueden formar con las letras de esta palabra es:
10!
= 151200
2!2!3!
1.15
Luego de constituido cada equipo, sus miembros son elementos indistinguibles del equipo lo que los
distingue del resto es que son de ese equipo. Razonemos de la siguiente manera y luego utilicemos
el principio de multiplicación para hallar el número total de equipos que se pueden organizar:
1.2 Técnicas de Conteo 21
Por el principio de multiplicación, el número total de equipos diferentes que se puede conformar es:
20 18 15 11 6 20! 18! 15! 11! 6! 20!
= =
2 3 4 5 62 2!18! 3!15! 4!11! 5!6! 0!6! 2!3!4!5!6!
es decir,
20
2, 3, 4, 5, 6
Espacios medibles
σ − Algebra
Espacio de Probabilidad
Probabilidad condicional e independen-
cia
Probabilidades totales y regla de Bayes
Independencia
2 — Espacio de probabilidad
Definición 2.1
Una sucesión de conjuntos en el espacio referencial Ω es una colección enumerada de
subconjuntos de Ω, (A j )∞j=1 , donde para cada j, j = 1, 2, . . ., A j ⊆ Ω.
Definición 2.2
Dada una sucesión (A j )∞j=1 se define la unión e intersección de esta sucesión de la siguiente
manera
• Unión:
∞
[
Ai = {x ∈ Ω : x ∈ Ai , para algún i}
i=1
• Intersección:
∞
\
Ai = {x ∈ Ω : x ∈ Ai , para todo i}
i=1
24 Espacio de probabilidad
II ) (A ∩ B)c = Ac ∪ Bc
c
III )
S∞
=
T∞ c
i=1 Di i=1 Di
c
IV )
T∞
=
S∞ c
i=1 Di i=1 Di
Proposición 2.3
Sean A y B subconjuntos de un espacio referencial Ω, entonces
I ) Si A ⊆ B entonces A ∩ B = A y A ∪ B = B
II ) A = (A ∩ B) ∪ (A ∩ Bc )
2.1.1 σ − Algebra
Definición 2.3 σ -algebra
Una colección F de subconjuntos de Ω, F ⊂ 2Ω , que satisface los siguientes tres axiomas:
a) Ω ∈ F
b) Si A ∈ F entonces Ac ∈ F
c) Si (A j )∞j=1 es una sucesión en F entonces ∞j=1 A j ∈ F
S
N El par (Ω, F) se llama espacio medible y los elementos de F se llaman conjuntos medibles o
eventos.
Proposición 2.4
Sea F una σ − algebra sobre Ω.
a) 0/ ∈ F
b) Si A, B ∈ F entonces A ∪ B ∈ F
c) Si (A j )∞j=1 ⊂ F entonces ∞j=1 A j ∈ F
T
2.1 Espacios medibles 25
d) Si A, B ∈ F, entonces A ∩ B ∈ F
e) Si A, B ∈ F, entonces B − A ∈ F
a) Como Ω ∈ F entonces 0/ = Ωc ∈ F.
b) Consideremos la sucesión (A j )∞j=1 ⊂ F, definida por A1 = A, A2 = B, 0/ = A3 = A4 . . ., entonces
S∞
j=1 A j = A1 ∪ A2 ∪ 0 / ∪ 0/ ∪ . . . = A ∪ B ∈ F
c) Como (A j ) j=1 ⊂ F entonces A j ∈ F, para cada j, j = 1, 2, . . ., luego A j c ∈ F, para cada
∞
2.1
a) Como Ω ∈ F y A = A ∩ Ω, entonces A ∈ FA
b) Sea W ∈ FA entonces existe B ∈ F tal que W = A ∩ B. Se probará que W c ∈ FA , W c := A −W ,
el complemento de W relativo a A
• Como B ∈ F entonces Bc = Ω − B ∈ F, por tanto A ∩ (Ω − B) = A ∩ Bc ∈ FA .
• A ∩W c = A −W = A − (A ∩ B) = A ∩ (A ∩ B)c = A ∩ (Ac ∪ Bc ) = (A ∩ Ac ) ∪ (A ∩ Bc ) =
∅ ∪ (A ∩ Bc ) = A ∩ Bc .
Así W c = A −W ∈ FA
c) Si (A j )∞j=1 es una sucesión en FA entonces para cada j, j = 1, 2, . . . existe un B j ∈ F tal
que A j = A ∩ B j , por tanto ∞j=1 A j = ∞j=1 (A ∩ B j ) = A ∩ ( ∞j=1 B j ); y como ∞j=1 B j ∈ F,
S S S S
entonces A ∩ ( ∞j=1 B j ) ∈ FA
S
F = f −1 (G) := { f −1 (G) : G ∈ G}
Teorema 2.1
a) Sea J ⊂ R, J 6= ∅. Si F j es una σ − algebra sobre Ω, para cada j ∈ J entonces la
colección \
F := Fj
j∈J
decir Bc ∈ F.
T
III ) Sea (A j )∞
j=1 una sucesión en F = j∈J F j , entonces
\
(A j )∞j=1 ⊂ Fj
j∈J
Definición 2.4
La σ − algebra F, construida en el teorema anterior, se denomina σ − algebra generada por
la colección C, y se simboliza σ (C).
2.2 Espacio de Probabilidad 27
2.2
Definición 2.5
Sea O n la colección de conjuntos abiertos en Rn entonces la σ − algebra generada por O n ,
σ (O n ) se llama la σ − algebra de Borel sobre Rn , se denota por B(Rn ) o simplemente
por Bn si se sobreentiende que se está trabajando en Rn . Los elementos de Bn se llaman
conjuntos de Borel.
Definición 2.6
Sea (Ω, F) un espacio medible. Una función µ : F −→ [0, ∞) tal que
I ) No negativa: µ(A) ≥ 0, para todo A ∈ F
II ) Contablemente aditiva: µ(∪ j A j ) = ∑ j µ(A j ), para cualquier sucesión, contable, de
conjuntos disyuntos A j ∈ F
se llama una medida sobre (Ω, F). La tripla (Ω, F, µ) se llama espacio de medida.
Definición 2.7
Un experimento es aleatorio si sus resultados no se pueden predecir con certeza, además si el
experimento se repite bajo las mismas condiciones entonces los resultados posibles ocurren
con cierta regularidad estadística.
2.3
Definición 2.8
El conjunto de todos los resultados posibles de un experimento aleatorio se llama espacio
muestral. Es usual denotarlo con la letra Ω.
Definición 2.9
Una medida µ sobre un espacio medible (Ω, F) tal que µ(Ω) = 1 se llama una medida de
probabilidad (denotaremos la medida de probabilidad µ por P.). La tripla (Ω, F, P) se llama
espacio de probabilidad.
2.4
luego
| ∪nj=1 A j | 1 n 1 n n
|A j | n
P(∪nj=1 A j ) = = | ∪ A j| = ∑ |A j | = ∑ = ∑ P(A j )
N N j=1 N j=1 j=1 N j=1
|Ω| N
c) µ(Ω) = N = N = 1.
Teorema 2.2
Sea (Ω, F, P) un espacio de probabilidad, A, B, A j , eventos en F. Entonces
I ) Monotonía: Si A ⊆ B entonces P(A) ≤ P(B)
II ) Continuidad desde abajo: Si la sucesión de eventos (A j ) j es tal que A1 ⊆ A2 ⊆ . . ., y
2.2 Espacio de Probabilidad 29
Además en este caso, es decir para A ⊆ B, podemos concluir que P(B − A) = P(B) − P(A)
II ) Definimos una nueva sucesión de eventos, disyuntos dos a dos, de la siguiente manera:
B1 = A1 , B2 = A2 − A1 , B3 = A3 − A2 , . . . , Bn = An − An−1 , . . .
A1 = B1 , A2 = B1 ∪ B2 , . . . , An = ∪nj=1 B j , . . .
∞
[ ∞
[
Bj = Aj = A
j=1 j=1
Ahora bien
∞
[
P(A) = P Bj
j=1
∞
= ∑ P(B j ) por σ − aditividad
j=1
n
= lı́m ∑ P(B j ) por convergencia serie
n→∞
j=1
n
[
= lı́m P Bj por σ − aditividad
n→∞
j=1
III )Una construcción similar a la del numeral anterior permite demostrar esta afirmación.
IV ) Prueba por inducción matemática para la desigualdad:
X n = 1: P(A1 ) ≤ P(A1 )
X n = 2: P(A1 ∪ A2 ) = P(A1 ) + P(A1 ) − P(A1 ∩ A2 ) ≤ P(A1 ) + P(A1 )
30 Espacio de probabilidad
X n = 3:
3
[
3
P Aj = ∑ P(A j ) − ∑ P(Ai ∩ A j ) + P(A1 ∩ A2 ∩ A3 )
j=1 j=1 1≤i< j≤3
3
= ∑ P(A j ) − ∑ P(Ai ∩ A j ) − P(A1 ∩ A2 ∩ A3 )
j=1 1≤i< j≤3
3
≤ ∑ P(A j ) porque A1 ∩ A2 ∩ A3 ⊆ A1 ∩ A2
j=1
Sk
Prueba para n = k + 1, sea B = j=1 A j , entonces
k+1 k
[ [
P Aj =P A j ∪ Ak+1
j=1 j=1
= P(B ∪ Ak+1 )
≤ P(B) + P(Ak+1 ) por n = 2
k
≤ ∑ P(A j ) + P(Ak+1 ) por hipótesis inductiva
j=1
k+1
= ∑ P(A j )
j=1
A1 n=1
Bn =
n−1
j=1 A j ∪ An
S
n = 2, 3, . . .
satisface
n
[ n
[ ∞
[ ∞
[
B1 ⊆ B2 ⊆ . . . ⊆ Bn . . . ; Bj = A j, Bj = Aj
j=1 j=1 j=1 j=1
Proposición 2.7
Sea (Ω, F, P) un espacio de probabilidad, entonces
1) P(0)/ =0
2) Si A, B ∈ F, tales que A ∩ B = 0,
/ entonces P(A ∪ B) = P(A) + P(B)
3) Sean A, B ∈ Ω tales que A ⊂ B entonces P(A) ≤ P(B) y P(B − A) = P(B) − P(A)
4) Si A, B ∈ F, entonces P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
5) P(Ac ) = 1 − P(A)
1) Como Ω ∩ 0/ = 0/ y Ω = Ω ∪ 0,
/ entonces aplicando el axioma P3 obtenemos
/ =0
por tanto P(0)
2) Consideremos la sucesión de eventos (A j )∞j=1 definida por
/ ∀n ≥ 3
A1 = A, A2 = B, An = 0,
5) Como Ω = A ∪ Ac , y A ∩ Ac = 0,
/ entonces
2.5
Un grupo consta de n personas. ¿Cuál es la probabilidad que por lo menos dos personas
cumplan años en el mismo día? Asumamos que el año no es bisiesto y que cada día del año es
igualmente probable para un nacimiento.
Idealizamos la situación suponiendo que los días del año se han marcada en balotas que han sido
colocadas en una urna, el nacimiento de cada individuo corresponde a la extracción al azar de una
balota de la urna. Y denotamos con A el evento de interés
× . . . × 365} = 365n
| × 365{z
365
n veces
X Casos favorables: Cada persona cumple años un día distinto de todos y cada uno de los
demás:
365 364 363 ... 365 − (n − 2) 365 − (n − 1)
↑ ↑ ↑ ... ↑ ↑
1o 2o 3o ... (n − 1) − ésimo n − ésimo
es decir
365!
(365) × (364) × . . . (365 − (n − 1)) =
(365 − n)!
Por tanto la probabilidad de que ningún par de personas, de un grupo de n individuos, cumpla años
en el mismo día es:
365!
(365−n)!
365n
En consecuencia, la probabilidad de que dos o más personas,de las n en el grupo, cumpla años el
mismo día es:
365!
(365−n)!
1−
365n
En la siguiente tabla se ilustran algunos valores de la probabilidad de que dos o más personas
cumplan años en un mismo día, para diferentes valores de n el tamaño del grupo de individuos.
2.2 Espacio de Probabilidad 33
Proposición 2.8
Principio de inclusión - exclusión
Para cualquier conjunto de eventos {A1 , A2 , . . . , An } en un espacio de probabilidad (Ω, F, P)
se verifica la fórmula:
n
[ n
P( A j ) = ∑ P(Ai )− ∑ P(Ai ∩A j )+ ∑ P(Ai ∩A j ∩Ak )+. . .+(−1)n+1 P(A1 ∩A2 . . .∩An )
j=1 i=1 i< j i< j<k
En efecto
I ) n = 2: P(A1 ∪ A2 ) = P(A1 ) + P(A2 ) − P(A1 ∩ A2 )
II ) n = 3: P(A1 ∪ A2 ∪ A3 ) = P[(A1 ∪ A2 ) ∪ A3 ]
= P(A1 ∪ A2 ) + P(A3 ) − P[(A1 ∪ A2 ) ∩ A3 ]
= P(A1 ) + P(A2 ) − P(A1 ∩ A2 ) + P(A3 ) − P[(A1 ∩ A3 ) ∪ (A2 ∩ A3 )]
= P(A1 ) + P(A2 ) + P(A3 ) − P(A1 ∩ A2 ) − P(A1 ∩ A3 ) − P(A2 ∩ A3 ) + P(A1 ∩ A2 ∩ A3 )
III ) Hipótesis de inducción, n:
n
[ n
P( A j ) = ∑ P(Ai ) − ∑ P(Ai ∩ A j ) + ∑ P(Ai ∩ A j ∩ Ak ) + . . . + (−1)n+1 P(A1 ∩ A2 . . . ∩ An )
j=1 i=1 i< j i< j<k
Sn
IV ) Tesis de inducción: n+1: Sea B := j=1 A j , entonces
n+1
[
P Aj = P(B ∪ An+1 )
j=1
2.6
Denotemos con A el evento “cálculo” y con B el evento “física”, entonces P(A) = 0.8, P(B) = 0.5 y
P(A ∩ B) = 0.4.
a) El evento A ∪ B representa el suceso que un estudiante de primer semestre de ingeniería tome
al menos una de estas asignaturas, luego
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = 0.8 + 0.5 − 0.4 = 0.9
b) La representación del suceso: un estudiante de primer semestre de ingeniería toma exactamente
una de las dos asignaturas, cálculo o física, está dada por el evento (A ∩ Bc ) ∪ (B ∩ Ac ), por
tanto debemos hallar
P(A ∩ Bc ) + P(B ∩ Ac )
X Como A = (A ∩ B) ∪ (A ∩ Bc ), entonces
P(A) = P(A ∩ B) + P(A ∩ Bc ) ⇒ P(A ∩ Bc ) = 0.8 − 0.4 = 0.4
X Como B = (B ∩ A) ∪ (B ∩ Ac ), entonces
P(B) = P(B ∩ A) + P(B ∩ Ac ) ⇒ P(B ∩ Ac ) = 0.5 − 0.4 = 0.1
por tanto
P(A ∩ Bc ) + P(B ∩ Ac ) = 0.4 + 0.1 = 0.5
Una forma alterna es calcular
P(A ∪ B) − P(A ∩ B) = 0.9 − 0.4 = 0.5
N Un naipe, o mazo de cartas, está constituido por 4 pintas, dos de color rojo y dos de color
negro:
X Picas: ♠.
X Tréboles: ♣.
X Corazones: ♥.
X Diamantes: ♦.
Cada pinta, suit, está formada por 13 cartas rotuladas: A, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K, las
figuras A,J, Q, K corresponden a un As, un Jocker, queen y king, respectivamente.
2.2 Espacio de Probabilidad 35
2.7
a) Casos totales
Si no imponemos la condición “obtener una carta, por lo menos, de cada pinta”, entonces el
número de muestras no ordenadas y sin repetición (6 cartas de un mazo de 52 cartas) es:
52
6
b) Consideremos los eventos siguientes:
X E: muestras donde no salen cartas del palo de picas.
X T : muestras donde no salen cartas del palo de tréboles.
X C: muestras donde no salen cartas del palo de corazones.
X D: muestras donde no salen cartas del palo de diamantes.
Entonces debemos calcular
52
− |E ∪ T ∪C ∪ D|
6
El principio de inclusión-exclusión, para conteo, nos permite calcular
|E ∪T ∪C ∪D| = |E|+|T |+|C|+|D|−|E ∩T |−|E ∩C|−|E ∩D|−|T ∩C|−|T ∩D|−|C ∩D|+
|E ∩ T ∩C| + |E ∩ T ∩ D| + |E ∩C ∩ D| + |T ∩C ∩ D| − |E ∩ T ∩C ∩ D|
Observaciones y cuentas:
X Cada muestra de 6 cartas contendrá como mínimo cartas de un palo, por tanto el evento
E ∩ T ∩C∩ D no tendrá elementos, es decir |E ∩ T ∩C ∩ D| = 0.
X |E| = 39 6 , porque estas muestras no contendrán cartas del palo de picas, es decir la
muestra proviene de las 39 cartas que constituyen las de los otros tres palos. Similarmente
39
|T | = |C| = |D| =
6
X |E ∩ T | = 26
6 , porque estas muestras no contendrán cartas ni del palo de picas ni del
palo de tréboles, es decir la muestra proviene de las 26 cartas que constituyen las de los
otros tres palos. Similarmente
26
|E ∩C| = |E ∩ D| = |T ∩C| = |T ∩ D| = |C ∩ D| =
6
X |E ∩ T ∩C| = |E ∩ T ∩ D| = |T ∩C ∩ D| = 13
6
Por tanto el número de muestras de 6 cartas, sacadas aleatoriamente de un mazo de 52 cartas,
sin orden y sin devolución, de manera que cada muestra tenga por lo menos una carta de cada
pinta es:
52 39 26 13
−4 +6 −4 = 8682544
6 6 6 6
36 Espacio de probabilidad
Entonces la la probabilidad de sacar 6 cartas de un mazo de 52 cartas, de modo que se obtenga, por
lo menos, una carta de cada pinta es:
52 39 26 13
6 −4 6 +6 6 −4 6
52
≈ 42.65 %
6
2.8
a) Se elige al azar una persona de este grupo, cuál es la probabilidad de que sea fumadora?
b) Se elige al azar una persona de este grupo, cuál es la probabilidad de que sea fumadora,
si se sabe que es una mujer?
Veamos:
a) Del total de 100 personas solamente 13 son fumadoras, por tanto la probabilidad de que la
persona elegida al azar sea fumadora es:
13
= 0, 13 = 13 %
100
b) Como se sabe previamente, que la persona elegida al azar es mujer, entonces reducimos nuestro
espacio solamente a la clase “Mujeres”, que en número son 60. Por tanto la probabilidad de
que esta persona sea fumadora es:
5
= 0, 083 ≈ 8, 33 %
60
Definición 2.10
Sea (Ω, F, P) un espacio de probabilidad, y B ∈ F tal que P(B) > 0. Se define la medida de
probabilidad condicional de A ∈ F dado B por:
P(A ∩ B)
P(A|B) :=
P(B)
Proposición 2.9
Dado B ∈ F, la función
P( , B) : F −→ R
A −→ P(A|B)
es una medida de probabilidad sobre el espacio medible (Ω, F)
P(Ω ∩ B) P(B)
• P1: P(Ω|B) = = =1
P(B) P(B)
P(A ∩ B)
• P2: P(A|B) = ≥0
P(B)
• P3: Sea (A j )∞j=1 , una sucesión de eventos, disyuntos dos a dos, en F, entonces:
∞
[
∞
[
Aj ∩B = (A j ∩ B)
j=1 j=1
(Ai ∩ B) ∩ (A j ∩ B) = (Ai ∩ A j ) ∩ B = 0/ ∩ B = 0/
entonces la sucesión (A j ∩ B)∞j=1 es disyunta dos a dos, luego
S∞
∞
[ P( j=1 A j ∩ B) ∑∞j=1 P(A j ∩ B) ∞
P(A j ∩ B) ∞
P( A j |B) = = = ∑ = ∑ P(A j |B)
j=1
P(B) P(B) j=1 P(B) j=1
N
X Si A es un evento en el espacio de probabilidad (Ω, F, P), entonces A ∩ Ω = A y por tanto
P(A ∩ Ω)
P(A|Ω) = = P(A)
P(Ω)
2.9
Supongamos que se tienen las siguientes probabilidades: P(A) = 0.3; P(B|A) = 0.75;
P(B|Ac ) = 0.2; P(C|A∩B) = 0.2; P(C|Ac ∩B) = 0.15; P(C|A∩Bc ) = 0.8; P(C|Ac ∩Bc ) = 0.9.
Entonces
9
X P(B|A) = P(B∩A)
P(A) ⇒ P(A ∩ B) = P(B|A)P(A) = 0.75 × 0.3 = 40
9
X P(C|A ∩ B) = 0.2 ⇒ P(C ∩ B ∩ A) = 0.2P(A ∩ B) = 0.2 × 40 = 0, 045, por tanto P(A ∩
38 Espacio de probabilidad
B ∩C) = 0.045
X Como Bc ∩ C = Ω ∩ (Bc ∩ C) = (A ∪ Ac ) ∩ (Bc ∩ C) = (A ∩ Bc ∩ C) ∪ (Ac ∩ Bc ∩ C)
entonces P(Bc ∩C) = P(A ∩ Bc ∩C) + P(Ac ∩ Bc ∩C), entonces
Proposición 2.10
Sea A1 , A2 , . . . , Am , m eventos del espacio de probabilidad (Ω, F, P), entonces
P(Am ∩Am−1 ∩. . .∩A2 ∩A1 ) = P(Am |Am−1 ∩Am−2 ∩. . .∩A2 ∩A1 )×. . .×P(A2 |A1 )×P(A1 )
P(Am ∩ Am−1 ∩ . . . ∩ A2 ∩ A1 ) = P Am ∩ (Am−1 ∩ . . . ∩ A2 ∩ A1 )
2.10
por tanto
20 19 18 17
P(A1 ∩ A2 ∩ A3 ∩ A4 ) = × × × ≈ 7, 5 × 10−5 = 0, 000075
200 199 198 197
Veamos un ejemplo similar al anterior en el cual consideraremos las opciones de “muestreo con
reemplazo” y “muestreo sin reemplazo”, e induciremos el concepto de independencia entre eventos.
2.3 Probabilidad condicional e independencia 39
2.11
Una urna tiene 50 balotas idénticas salvo por su color, 20 son rojas y 30 son negras. Se
seleccionan tres balotas al azar de la urna, una por una. Cuál es la probabilidad de que las tres
bolas sean rojas?
N
X Observemos que en este caso la probabilidad de cada evento, salvo el primero, es afectada
por la ocurrencia del evento o eventos anteriores, a diferencia del caso con reemplazo
donde la probabilidad de cada evento permanece invariable e igual a la del primer evento.
X Intuitivamente, si la ocurrencia del evento B no afecta la probabilidad de ocurrencia del
P(A ∩ B)
evento A, entonces P(A|B) = P(A). Esta ecuación implica = P(A), por tanto
P(B)
P(A ∩ B) = P(A)P(B). En este caso diremos que los eventos A y B son independientes.
Definición 2.11
Los eventos A y B son independientes, respecto de la medida de probabilidad P, si y solamente
si satisfacen la igualdad
P(A ∩ B) = P(A)P(B)
Proposición 2.11
Sean A y B eventos de un espacio de probabilidad (Ω, F, P)
a) Si P(B) > 0, entonces P(Ac |B) = 1 − P(A|B)
b) Si A y B son eventos independientes entonces también son eventos independientes:
A y Bc , Ac y B, Ac y Bc ; es decir P(A ∩ Bc ) = P(A)P(Bc ), P(Ac ∩ B) = P(Ac )P(B), y
P(Ac ∩ Bc ) = P(Ac )P(Bc )
c) El evento A es independiente del evento cierto Ω.
d) Si A y B son eventos mutuamente excluyentes entonces P(A|B) = 0, para B tal que
40 Espacio de probabilidad
P(B) > 0
P(A ∩ B) = P(A)P(B)
Ahora bien
por tanto
Definición 2.12
Sea (A j )∞j=1 una sucesión de eventos en un espacio de probabilidad (Ω, F, P).
(A j )∞j=1 es independiente si y solo si para cualquier subsucesión finita, Ai1 , Ai2 , . . . , Aik con
k ≥ 2, de (A j )∞j=1 , se satisface la ecuación:
Es decir, cualquier pareja, tripla, cuadrupla, etcétera, de eventos de la sucesión debe satisfacer la
ecuación anterior.
2.12
Una urna tiene cuatro fichas rotuladas así: AAA, CAC, ACC y CCA. Se extrae aleatoriamente
una ficha. Considere los eventos:
X A1 el primer caracter de la ficha es C
X A2 el segundo caracter de la ficha es C
X A3 el tercer caracter de la ficha es C
entonces A1 = {CAC,CCA}, A2 = {ACC,CCA} y A3 = {CAC, ACC}
a) Los eventos A1 , A2 y A3 , son independiente dos a dos:
1 1 1
P(A1 ∩ A2 ) = = · = P(A1 ) · P(A2 )
4 2 2
1 1 1
P(A1 ∩ A3 ) = = · = P(A1 ) · P(A3 )
4 2 2
1 1 1
P(A2 ∩ A3 ) = = · = P(A2 ) · P(A3 )
4 2 2
b) Los eventos A1 , A2 y A3 , no son independiente tres a tres:
1 1 1
P(A1 ∩ A2 ∩ A3 ) = P(0)
/ = 0 6= · · = P(A1 ) · P(A2 ) · P(A3 )
2 2 2
2.13
por tanto los eventos A, B y C son independientes dos a dos. Sin embargo no son independientes
tres a tres porque
1
A ∩ B ∩C = {(2, 5)} =⇒ P(A ∩ B ∩C) =
36
pero
1 1 1 1
P(A) · P(B) · P(C) = · · = =⇒ P(A ∩ B ∩C) 6= P(A) · P(B) · P(C)
6 6 6 216
Proposición 2.12
Si la sucesión de eventos (A j )∞j=1 , en el espacio de probabilidad (Ω, F, P), es independiente
entonces es independiente por pares.
Para el caso de triplas de eventos se tiene la siguiente proposición que simplifica la implicación de
independencia por pares.
Proposición 2.13
Supongamos que los eventos A, B y C satisfacen las condiciones
En efecto, haremos la prueba para A y B, los otros dos casos son similares.
entonces
P(A ∩ B) = P (A ∩ B ∩C) ∪ (A ∩ B ∩Cc )
= P(A ∩ B ∩C) + P(A ∩ B ∩Cc )
= P(A)P(B)P(C) + P(A)P(B)P(Cc )
= P(A)P(B)(P(C) + P(Cc ))
= P(A)P(B)
Definición 2.13
Sea (Ω, F) una colección de eventos de Ω, (Bα )α∈I ⊂ F con I 6= 0,
/ es una partición de Ω si y
solamente si satisface:
a) Para todo α, β ∈ I, α 6= β
Bα ∩ Bβ = 0/
b)
[
Bα = Ω
α∈I
Proposición 2.14
Sea (Ω, F) un espacio medible. Si (Bα )α∈I ⊂ F es una partición de Ω, y A ∈ F entonces:
[
A= (A ∩ Bα )
α∈I
Proposición 2.15
Regla de las probabilidades totales
Sea {B1 , B2 , . . . , Bm } una partición en el espacio de probabilidad (Ω, F, P). Entonces:
a) Para todo evento A ∈ F
m
P(A) = ∑ P(A ∩ B j )
j=1
Es claro que
m
[
m
[
A = A∩Ω = A∩ Bj = (A ∩ B j )
j=1 j=1
b) Consecuencia del principio de multiplicación para dos eventos P(A ∩ B) = P(A|B) · P(B):
m m
P(A) = ∑ P(A ∩ B j ) = ∑ P(A|B j ) · P(B j )
j=1 j=1
2.14
Una empresa de soluciones electrónicas para seguridad industrial recibe un tipo de dispositivo
de tres proveedores distintos (el dispositivo es indistinguible luego de que es almacenado).
Proveedor A con una participación del 40 %, proveedor B con una participación del 35 %
y proveedor C con una participación del 25 %. Por anteriores pedidos el área de control de
calidad sabe el porcentaje de dispositivos defectusos que llega de cada proveedor, 2 % para el
proveedor A, 1, 5 % para el B y 1 % para el C.
La empresa recibe los lotes de dispositivos de los tres proveedores y los almacena.
a) Determine la probabilidad de que un dispositivo seleccionado al azar sea defectuoso.
b) Determine la probabilidad de que un dispositivo seleccionado al azar sea del proveedor
A si en la prueba técnica resultó defectuoso.
Denotemos con A el evento “el dispositivo es defectuoso”, B1 el dispositivo es del proveedor
A, B2 el dispositivo es del proveedor B, B3 el dispositivo es del proveedor C.
Por la información sabemos que:
0, 02 × 0, 40
P(B1 |A) = ≈ 51 %
0, 01575
2.4 Probabilidades totales y regla de Bayes 45
P(A|B j )P(B j )
P(B j |A) = n
∑i=1 P(A|Bi )P(Bi )
2.15
Un sistema de comunicación envía datos binarios (0 o 1) los cuales son detectados por quien
los recibe. Quien los recibe ocasionalmente comete errores y algunas veces un 0 que es enviado
es detectado como un 1 o un 1 enviado es detectado como un 0. Suponga que el sistema de
comunicación está descrito por el siguiente conjunto de probabilidades condicionales:
1
a) Es claro que P(0 trans) = 2 y P(1 trans) = 21 . Entonces aplicando el Teorema de Probabili-
dades totales tenemos:
P(0 recib) = P(0 recib|0 trans)P(0 trans) + P(0 recib|1 trans)P(1 trans)
1 1
P(0 recib) = 0.95 × + 0.10 × = 0.525
2 2
De manera similar
P(1 recib) = P(1 recib|0 trans)P(0 trans) + P(1 recib|1 trans)P(1 trans)
1 1
P(1 recib) = 0.05 × + 0.90 × = 0.475
2 2
b) Aplicando el Teorema de Bayes:
P(0 recib|1 trans)P(1 tans) 0.10 × 12
P(1 trans|0 recib) = = = 0.0952381
P(0 recib) 0.525
46 Espacio de probabilidad
2.16
Al leer un artículo que trate de un estudio de una prueba diagnóstica, la presencia o ausencia de la
enfermedad tiene que ser determinada usando alguna fuente de información conocida como patrón
de referencia (que es una prueba diagnóstica que define la presencia de la enfermedad con la máxima
certeza conocida).
Sp = P(T − |D−)
2.17
X Eventos:
P(+) = P(+|D) · P(D) + P(+|Dc ) · P(Dc ) = 0.998 · 0.01 + 0.05 · (1 − 0.01) = 0.05948
Por tanto
0.998 · 0.01
P(D|+) = = 0.168
0.05948
Es decir Si una prueba diagnóstica de positiva, entonces la probabilidad de que el paciente
tenga la enfermedad es aproximadamente 16.8 %.
48 Espacio de probabilidad
2.5 Independencia
Ejercicios 2.1
1) Un dado legal se lanza seis veces. Determinar las siguientes probabilidades:
a) Por lo menos dos resultados son iguales.
b) Todos los resultados son diferentes y la suma es superior a ocho.
c) La suma de los resultados es divisible por tres.
2) La caja 1 contiene 2 balotas rojas y 4 balotas azules, mientras que la caja 2 contiene 1 balota
roja y 1 balota azul. Se saca, aleatoriamente, una balota de la caja 1 y se coloca en le caja 2,
entonces una balota de la caja 2 es seleccionada aleatoriamente y colocada en la caja 1.
a) Determinar la probabilidad que la balota seleccionada de la caja 2 sea roja.
b) Determinar la probabilidad que la balota transferida de la caja 1 a la caja 2 sea roja si
se sabe que la balota transferida de la caja 2 a la caja 1 fue roja.
3) Supongamos que 41 personas participan en un concurso en el que se eligen tres ganadores
al azar. los el primer participante elegido gana $500, el segundo participante elegido gana
$400, y el el tercer concursante elegido gana $250.
a) ¿Cuántos resultados diferentes son posibles?
b) Si los tres ganadores reciben $250, ¿cuántos resultados diferentes son posibles?
4) La caja 1 contiene 2 balotas rojas y 5 balotas azules, mientras que la caja 2 contiene 1
balota roja y 2 balotaazul. Una balota es seleccionada aleatoriamente, de una de las cajas
seleccionada aleatoriamente.
a) Determinar la probabilidad que la balota seleccionada sea roja.
b) Determinar la probabilidad que la balota sea de la caja 2 sea roja si se sabe que la
balota seleccionada fue roja.
c) Sea R el evento la balota es roja y A el evento la balota proviene de la caja 2. ¿Son
independientes estos eventos?
5) Las componentes A, B1 y B2 , operaran independientemente en un sistema electrónico, como
se muestra en la siguiente figura
Las probabilidades de que las componentes, funcionen por diez días sin falla alguna, son
P(A) = 0.9, P(B1 ) = 0.8, P(B2 ) = 0.7. El sistema trabaja si A1 trabaja y si B1 ó bien B2
trabaja. Se supone que los tres componentes entran en funcionamiento al mismo tiempo
y que una componente deja de trabaja una vez que se le presenta una falla. Determine la
probabilidad de que el sistema funcione.
6) Una urna contiene 10 balotas numeradas del 1 al 10. Se extraen cinco balotas al azar y sin
2.5 Independencia 49
reemplazo. Sea A el evento de que “exactamente dos se extraen bolas impares y ocurren en
sorteos impares de la urna”. ¿Cuál es la probabilidad del evento A?
7) Las componentes A, B1 y B2 , operaran independientemente en un sistema electrónico, como
se muestra en la siguiente figura
Las probabilidades de que las componentes, funcionen por una semana sin falla alguna,
son P(A) = 0.9, P(B1 ) = 0.9, P(B2 ) = 0.8. El sistema trabaja (es decir, trabaja sin falla)
si A1 trabaja y si B1 ó bien B2 trabaja. Se supone que los tres componentes entran en
funcionamiento al mismo tiempo y que una componente deja de trabaja una vez que se le
presenta una falla.
a) Determine la probabilidad de que el sistema funcione.
b) Suponga que la componente B1 falla en algún momento durante la semana. Halle la
probabilidad de que el sistema trabaje, sin falla, durante la semana.
8) Cuál de los siguientes dos eventos tiene la mayor probabilidad?
X Al menos un 6, al lanzar un dado legal cuatro veces.
X Al menos un doble seis, al lanzar un dado legal veinticuatro veces.
9) Un dado se carga de tal manera que la probabilidad de la cara con j puntos quede hacia
arriba es proporcional a j para j = 1, 2, 3, 4, 5, 6. En 6 lanzamientos independientes de este
dado, ¿cuál es la probabilidad de que cada cara aparezca exactamente una vez?
10) Una urna contiene 6 bolas rojas y 3 bolas azules. Se selecciona una bola en forma aleatoria
y se reemplaza por una bola del otro color. Una segunda bola es entonces seleccionada.
¿Cuál es la probabilidad de que la primera bola seleccionada sea roja, dado que la segunda
bola fue roja?
11) Una empresa de motocicletas tiene tres talleres de producción diferentes. El 5 % de las
motocicletas del taller 1, el 4 % del taller 2 y el 8 % del taller 3 han sido retiradas debido a
una falla en el embrague. Suponga que el 40 % de las motocicletas se producen en el taller 1,
el 35 % en el taller 2 y el 25 % en el taller 3. Si se ha retirado del mercado una motocicleta,
seleccionada al azar, Determinar:
a) la probabilidad de que provenga del taller 1.
b) la probabilidad de que provenga del taller 2.
c) la probabilidad de que provenga del taller 3.
12) Un convicto planea escapar de la prisión saliendo por el sistema de alcantarillado de la
prisión. Hay 4 alcantarillas en la prisión, pero solo una conduce al exterior. El prisionero
planea entrar en cada una de las alcantarillas al azar, sin volver a entrar nunca en una
alcantarilla fallida. ¿Cuál es la probabilidad de que el prisionero deba probar exactamente 1
50 Espacio de probabilidad
¿cuál es la probabilidad de que las dos balotas elegidas de la segunda urna sean rojas?
21) Seis niñas y seis niños se sientan en una fila que tiene 20 sillas. ¿Cuál es la probabilidad de
que se sienten en 12 sillas consecutivas si existen dos parejas (niña-niño),de manera que
cada pareja siempre se sientan la una al lado de la otra, pero las dos parejas no se sientan la
una al lado de la otra?
22) Diez invitados asistieron a una cena. El anfitrión había planeado dónde se sentaría cada
invitado, pero los invitados lo ignoraron y eligieron asientos al azar. Encuentre la probabi-
lidad de que como máximo dos invitados eligieron los asientos que el anfitrión les había
asignados.
Distribución de variables aleatorias
Medidas estadísticas de resumen
3 — Variables aleatorias
3.1
Las variables aleatorias nos permitirán medir eventos, mediante atributos numéricos. Presentaremos
algunos ejemplos.
3.2
Consideremos el experimento “lanzar una moneda legal dos veces”, queremos medir el
número de caras que salen.
El espacio muestral es Ω = {(C,C), (C, S), (S,C), (S, S)}, y la medida de probabilidad es la medida
equiprobable, es decir los eventos elementales C, S, tienen igual probabilidad P(C) = P(S) = 12 .
Consideremos la variable aleatoria X definida como “número de caras” que salen, por tanto X toma
los valores 0, 1, 2, una posible representación de la variable aleatoria X es mediante una tabla de
valores:
Resultados Valores de X
CC 2
CS 1
SC 1
SS 0
Valor de X Evento
2 {CC}
1 {CS, SC}
0 {SS}
1 1 3
P(X ≥ 1) = P({CS, SC,CC}) = P({CS, SC}∪{CC}) = P({CS, SC})+P({CC}) = P(X = 1)+P(X = 2) = + =
2 4 4
1 1 3
P(X ≤ 1) = P({SS,CS, SC}) = P({SS}∪{CS, SC}) = P({SS})+P({CS, SC}) = P(X = 0)+P(X = 1) = + =
4 2 4
La notación {X ≤ 1} significa {ω ∈ Ω : X(ω) ≤ 1} y {ω ∈ Ω : X(ω) ≤ 1} = {SS,CS, SC}
Proposición 3.1
Si B = (a, b], a < b, entonces P(X ∈ B) = P(a < X ≤ b) = P(X ≤ b) − P(X ≤ a)
por tanto
3.3
Valores de S 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
Probabilidad 36 36 36 36 36 36 36 36 36 36 36
3.4
Un experimento tiene espacio muestral Ω = {0, 1, 2} con medida de probabilidad dada por
P({0}) = 16 , P({1}) = 31 , P({2}) = 21 .
a) Hallar los valores que toman las siguientes variables:
I ) X = 2ω
II ) Y = ω 2
1
III ) Z = ω+1
b) Determine el valor de las siguientes probabilidades
I ) P(X < 4)
II ) P(0 < Y < 2)
III ) P(Z ≤ 0.5)
FX (x) := P(X ≤ x)
Proposición 3.2
a) FX es una función no-decreciente, es decir si x1 < x2 entonces FX (x1 ) ≤ FX (x2 ).
b) 0 ≤ FX (x) ≤ 1
c) lı́mx→∞ FX (x) = 1
d) lı́mx→−∞ FX (x) = 0
e) P(a < X ≤ b) = FX (b) − FX (a)
f) P(X = b) = FX (b) − FX (b− )
g) P(X > a) = 1 − p(X ≤ a) = 1 − FX (a)
Definición 3.3
La variable aleatoria X es discreta si su rango RX está contenido en un conjunto contable
de R. La variable aleatoria X tiene una función masa de probabilidad, fmp, f : R −→ [0, 1]
definida por
f (k) := P(X = k)
Proposición 3.3
Sea X una variable aleatoria discreta con fmp f , entonces
a) Para todo k ∈ RX , 0 ≤ f (k) ≤ 1
b) ∑k∈RX f (k) = 1
3.5
15 10
k 10−k
f (k) = 25
, k = 0, 1, . . . , 10
10
3.6
Un examen consta de 20 preguntas de selección múltiple con respuesta única, cada pregunta
tiene 4 opciones de respuestas, de las cuales solo una es correcta. Supongamos que cada
pregunta del examen se responde de manera aleatoria; sea N la variable aleatoria “número de
58 Variables aleatorias
Proposición 3.4
Si X es una variable aleatoria con función masa de probabilidad f (k), entonces
F(k) = ∑ f ( j)
j≤k
3.7
La variable aleatoria X, con rango RX = {1, 2, 3, 4, 5}, tiene función masa de probabilidad:
f (k) = C(3k − 2)
5 5
1
∑ C(3k − 2) = C ∑ (3k − 2) = C(45 − 10) = 35C ⇒ C = 35
k=1 k=1
por tanto
3k − 2
f (k) = , k = 1, 2, 3, 4, 5
35
b) Función de distribución de X
k
F(k) = ∑ f ( j)
j=1
entonces
1
35
si k = 1
5
si k = 2
35
F(k) = 12
si k = 3
35
22
35 si k = 4
35
si k = 5
35
3.1 Distribución de variables aleatorias 59
Proposición 3.5
Si el rango de la variable aleatoria discreta está dado por el conjunto finito ordenado RX =
{x1 , x2 , . . . , xn }, donde x j < x j+1 , para todo j = 1, 2, . . . n − 1, entonces
f (x1 ) = F(x1 )
f (x2 ) = F(x2 ) − F(x1 )
f (x3 ) = F(x3 ) − F(x2 )
..
.
f (xn ) = F(xn ) − F(xn−1 )
Definición 3.4
Una variable aleatoria X es continua si su función distribución FX se puede expresar como
Z x
FX (x) = f (t)dt, x ∈ R
−∞
para alguna función f : R −→ [0, ∞); esta función f se llama función de densidad de proba-
bilidad, fdp, de la variable aleatoria X.
Proposición 3.6
a) Si la fdp f es integrable entonces la función distribución F es continua.
b) Si la fdp f es continua en t = c ≤ x, entonces F es derivable en c y F 0 (c) = f (c)
3.8
b) (
1
b−a a<x<b
f (x) =
0 otro caso
60 Variables aleatorias
c)
1 − (x−µ)2
f (x) = √ e 2σ 2
2π
x ∈ R, para µ ∈ R y σ ∈ R+ , constantes. Su función de distribución es
Z x (t−µ)2
1
F(x) = √ e− 2σ 2 dt
−∞ 2π
E[X] = ∑ k f (k)
k∈RX
Definición 3.6
Sea X una variable aleatoria con función densidad de probabilidad f , entonces el valor
esperado de X, o esperanza de X, se define por
Z
E(X) = x f (x)dx
x∈RX
Proposición 3.7
Si g : R −→ R es una función continua y X : Ω −→ R es una variable aleatoria, entonces
g ◦ X := g(X) es una variable aleatoria sobre Ω, y
Z
E(g(X)) = g(x) f (x)dx
x∈RX
Proposición 3.8
Si X es una variable aleatoria discreta con valor esperado finito, entonces
E[aX + b] = aE[X] + b
En efecto
=a ∑ k f (k) + b ∑ f (k)
k∈RX k∈RX
= aE[X] + b · 1
= aE[X] + b
Proposición 3.9
Si X es una variable aleatoria continua con valor esperado finito, entonces
E[aX + b] = aE[X] + b
Z
E[aX + b] = (ax + b) f (x)dx
x∈RX
Z
= (ax f (x) + b f (x))dx
x∈RX
Z Z
=a x f (x)dx + b f (x)dx
x∈RX x∈RX
= aE(X) + b
1
Z ξ
P(X ≤ ξ ) = f (x)dx =
−∞ 2
si X es una variable aleatoria continua.
Definición 3.8
La moda de una variable aleatoria es el valor o valores de X que dan el máximo de la fmp o
de la fdp de X.
Una medida para la variabilidad o dispersión de una variable aleatoria X es la varianza denotada por
σX2 , donde σ > 0.
Definición 3.9
Sea X una variable aleatoria, la varianza de X se define por
donde µ := E(X)
Ejercicios 3.1
1. La variable aleatoria X tiene fdp
(
cxλ +1 (1 − x)λ 0 < x < 1
f (x) =
0 otro caso
donde λ > 0
moda
a) Halle la razón
mediana
moda
b) Halle la probabilidad de que X sea menor que la razón
mediana
3. La función de distribución de la variable aleatoria X, para x > 0, está dada por
3
x j e−x
F(x) = 1 − ∑
j=0 j!
Hallar:
3.2 Medidas estadísticas de resumen 63
a) La fdp de X
b) El valor esperado y la varianza de X.
4. La variable aleatoria X tiene función de distribución
(
1 − e−x x > 0
F(x) =
0 otro caso
Hallar P(0 ≤ eX ≤ 4)
5. Sea X variable aleatoria con fdp
(
αx2 e−10x x ≥ 0
f (x) =
0 otro caso
con α > 0 una constante. Determine la probabilidad que X sea mayor o igual que su moda.
6. La variable aleatoria X tiene fdp
(
(λ + 1)x2 0 < x < 1
f (x) =
0 otro caso
e3t
MX (t) = ; −1 < t < 1
1 − t2
e−|x|
f (x) = ; x∈R
2
a) Halle la función generadora de momentos de X
b) Determine el valor esperado y la varianza de X.
Modelo uniforme discreto
Modelo Bernoulli
Modelos binomial
Modelo geométrico
Modelo binomial negativo
MODELO HIPERGEOMÉTRICO
MODELO POISSON
4 — Modelos discretos
X : Ω −→ R
Se considera un experimento aleatorio arbitrario, y se observa una característica numérica que toma
un número finito de valores, {x1 , x2 , . . . , xn }, que por simplicidad los tomaremos como {1, 2, . . . , n},
todos con la misma probabilidad, es decir la función masa de probabilidad de X está dada por:
(
1
n, si x = k, k = 1, 2, . . . , n
P(X = x) =
0, si x 6= k, k = 1, 2, . . . , n
66 Modelos discretos
0, si x < 1
1
n, si 1 ≤ x < 2
2,
si 2 ≤ x < 3
n
P(X = x) = .
.
.
n−1
si n − 1 ≤ x < n
n ,
1, si n ≤ x
4.1
Considere el lanzamiento de un dado legal. La variable aleatoria que describe el número que
aparece en la cara superior del dado es uniforme discreta con fmp:
1
P(X = j) = , j = 1, 2, 3, 4, 5, 6
6
4.2
De una baraja española, que tiene 40 cartas distribuidas en 4 palos: espadas, oros, copas y
bastos (cada palo tiene cartas del 1 al 7 junto con tres figuras 10, 11 y 12). Al tener el mazo
de naipes bien barajado y seleccionar una carta al azar, la variable aleatoria que describe la
carta extraída es uniforme discreta con fmp:
1
P(X = j) = , si j = 1, 2, . . . , 40
40
Definición 4.2
Una variable aleatoria definida sobre el espacio muestral de un ensayo de Bernoulli, y que
toma los siguientes valores:
(
1, si el resultado es éxito
X=
0, si el resultado es fracaso
donde q := 1 − p.
X Valor esperado: E[X] = p
X Varianza: Var(X) = pq
X Función generadora de momentos: MX (t) = q + pet
X Notación: X ∼ B(1, p)
68 Modelos discretos
4.3
Un dado es cargado de manera que las caras del dado con número par de puntos tienen el doble
de probabilidad de salir que las caras con número impar. Si la variable aleatoria X modela si
el número que sale en la cara superior del dado, en un lanzamiento, es impar. Determine el
valor esperado de X.
En este caso el evento éxito corresponde a que salga un número impar, de esta manera la variable
aleatoria tomara dos valores posibles: 1 si en el dado sale un número impar y 0 si en el dado sale un
número par de puntos, en consecuencia la fmp para X es:
(
1
, si k = 1
P(X = k) = 32
3 , si k = 0
1
por tanto E(X) = ∑1k=0 kP(X = k) = 0 · P(X = 0) + 1 · P(X = 1) =
3
4.4
Una pregunta de un examen de selección múltiple cuenta con cuatro respuestas posibles,
una sola de las cuales es correcta y las otras tres son incorrectas. Sea X la variable aleatoria
definida como 1 si la respuesta seleccionada es la correcta y 0 si las respuesta seleccionada es
incorrecta en una pregunta. Entonces la fmp de X es:
(
1
si k = 1
P(X = k) = 43
4 si k = 0
Definición 4.4
La variable aleatoria X que mide el número de éxitos en un modelo binomial con n repeticio-
nes del ensayo Bernoulli, se llama variable binomial.
Funciones en el programa R
A continuación referenciamos las funciones más importantes del modelo Binomial que el programa
R tiene implementadas:
Función Características
dbinom(x,size,prob,log=F) Devuelve el valor de la fmp
pbinom(q,size,prob,lower.tail=T,log.p=F) Devuelve el valor de la FD
qbinom(p,size,prob,lower.tail=T,log.p=F) Devuelve el cuantil q
rbinom(n,size,prob) Devuelve un n-vector valores binomiales aleatorios
Las gráficas de la función masa de probabilidad del modelo binomial X ∼ Bin(n = 10, p = 0.6) y su
función de distribución, se muestra a continuación:
4.5
El modelo es binomial ya que cada pregunta es un ensayo de Bernoulli (“éxito” si responde bien,
“fracaso” si responde mal), cada respuesta es seleccionada con independencia de lo seleccionado en
el resto.
70 Modelos discretos
Sea X la v.a. “número de preguntas bien contestadas”, entonces X ∼ B(n = 20, p = 0.2). La solución
al interrogante de aprobar el examen es:
20
20
P(X ≥ 14) = ∑ (0.2)k (0.8)20−k ≈ 1.85 × 10−6
k=14 k
4.6
Un reconocido médico asegura que el 60 % de los pacientes que padecen de cáncer de pulmón
son fumadores habituales. Aceptando que la afirmación de este médico es verdadera hallar la
probabilidad que:
a) de 10 pacientes recientemente admitidos al hospital, menos de la mitad son fumadores
habituales.
b) de 20 pacientes recientemente admitidos al hospital, menos de la mitad son fumadores
habituales.
b)
9
20
P(X ≤ 9) = ∑ (0.6)k (0.4)20−k ≈ 0.13
k=0 k
4.3 Modelos binomial 71
Proposición 4.1
Sea X una variable aleatoria binomial con parámetros n y p, 0 < p < 1, y función masa de
probabilidad p(x). Entonces p(x) es máxima para x = b(n + 1)pc
a
Observemos que
n! k n−k
p(k) k!(n−k)! p (1 − p)
= n!
p(k − 1) (k−1)!(n−k+1)! p
k−1 (1 − p)n−k+1
(n + 1)p − k
= +1
k(1 − p)
Esta igualdad
p(k) (n + 1)p − k
= +1
p(k − 1) k(1 − p)
implica que p(k) > p(k −1) si y solamente si (n+1)p−k > 0, es decir si y solamente si k < (n+1)p.
De esta manera cuando k cambia de 0 a b(n + 1)pc, entonces p(k) crece y cuando k cambia
de b(n + 1)pc a n, entonces p(k) decrece, por consiguiente el máximo valor de p(k) ocurre en
k = b(n + 1)pc
4.7
Un jugador de fútbol erra tiros desde el punto penal con probabilidad 0.65. Determine el o
los valores de k para el cual, k goles en diez tiros desde el punto penal es máximo, y halle su
probabilidad.
Cada tiro desde el punto penal es un ensayo Bernoulli: hace gol (éxito) con probabilidad 0.35 o no
hace gol (fracaso) con probabilidad 0.65. Cada disparo desde el punto penal es independiente del
disparo anterior y del resto de disparos que se han dado, por tanto tenemos un modelo binomial
donde X, la variable aleatoria mide el número de goles hechos en 10 tiros; es decir X ∼ Bin(n =
10, p = 0.65), entonces el valor
máximo probable se obtiene en k = b(10 + 1)0.65c = 7 y su valor
10
de probabilidad es p(7) = 7 (0.65) (0.35)3 ≈ 0.25
7
Ejercicios 4.1
1. En cierta localidad de una ciudad, la necesidad por conseguir dinero para comprar droga es
establecida como la razón principal para el 75 % de todos los robos. Hallar la probabilidad
que entre los siguientes cinco casos de robo en esta localidad,
a) exactamente 2 resulten de la necesidad para adquirir droga.
b) a lo más 3 resulten de la necesidad para conseguir dinero para comprar droga.
2. Se lanza un dado legal 5 veces. Un éxito es cuando la cara superior del dado muestra un
número primo. Determinar la probabilidad de obtener tres números primos.
72 Modelos discretos
3. Supongamos que en una caja de 100 chips de computadora, la probabilidad de que un chip
sea defectuoso es del 3 %. El proceso de inspección para chips defectuosos consiste en
seleccionar al azar de la caja 5 chips, con reemplazo; la caja se envía si ninguno de los cinco
chips está defectuoso.
a) Escriba la variable aleatoria de interés.
b) Escriba la fmp de la variable aleatoria definida.
c) Determine la probabilidad de que la caja de chips sea enviada.
4. Suponga que 40 % de los potenciales votantes de una ciudad están en favor de colocar vallas
publicitarias mostrando los individuos corruptos. Suponga que se seleccionan al azar 5
potenciales votantes de la ciudad. Hallar la probabilidad de que:
a) 2 estén a favor.
b) menos de 4 estén a favor.
c) al menos uno esté a favor.
5. Un estudiante toma un test consistente de 10 preguntas de verdadero-falso.
a) Cuál es la probabilidad que el estudiante responda correctamente al menos 6 preguntas?
b) Cuál es la probabilidad que el estudiante responda a lo más 3 preguntas correctamente?
6. Un estudio de salud muestra que el 25 % de personas con edades entre 50 y 60 años, en cierta
ciudad, tienen presión arterial alta. Cuál es la probabilidad que en una muestra aleatoria de
20 personas con edades entre 50 y 60, más de 15 tengan presión alta.
7. Un sistema de comunicación consiste de n componentes, cada una de las cuales funcio-
nará, independientemente del resto con probabilidad p. El sistema completo funcionará
efectivamente si al menos la mitad de sus componentes funciona.
a) Determine los valores de p para los cuales un sistema de 5 componentes operará más
efectivamente que un sistema de 3 componentes.
b) En general, en que caso o casos un sistema de 2k + 1 componentes funcionará más
efectivamente que un sistema con 2k − 1 componentes?
8. Se sabe que los tornillos producidos por una determinada compañía serán defectuosos con
probabilidad 0.01, independientemente el uno del otro. La compañía vende los tornillos
en paquetes de 10 y ofrece una garantía de devolución de dinero si en el paquete hay no
más de un tornillo defectuoso. ¿Qué proporción de paquetes vendidos debe reemplazar la
compañía?
9. El siguiente juego, conocido como la rueda de la fortuna (o chuck-a-luck), es bastante
popular en muchos carnavales y casinos de juego: un jugador apuesta en uno de los números
del 1 al 6. Luego se lanzan tres dados, y si el número apostado por el jugador aparece i
veces, i = 1, 2, 3, entonces el jugador gana i unidades; si el número apostado por el jugador
no aparece en ninguno de los dados, entonces el jugador pierde 1 unidad. ¿Es este juego
justo para el jugador? (En realidad, el juego se juega haciendo girar una rueda que se
detiene en una ranura etiquetada por tres de los números del 1 al 6, pero esta variante es
matemáticamente equivalente a la versión de los dados.)
10. Supongamos que un rasgo particular (como el color de ojos o la zurdera) de una persona es
clasificados sobre la base de un par de genes, y supongamos también que d representa un
gen dominante y r un gen recesivo. Por lo tanto, una persona con genes dd es puramente
dominante, y una con rr es puramente recesivo, y uno con rd es híbrido. El puramente
4.3 Modelos binomial 73
dominante y los individuos híbridos son parecidos en apariencia. Los niños reciben un gen
de cada padre. Si, con respecto a un rasgo particular, dos padres híbridos tienen un total de
4 hijos, ¿Cuál es la probabilidad de que tres de los cuatro niños tengan la apariencia externa
del gen dominante?
11. Una empresa está considerando perforar cuatro pozos petroleros. La probabilidad de éxito
de cada pozo es de 40 %, independientemente de los resultados de cualquier otro pozo. El
costo de perforar cada pozo es de US$200, 000. Cada pozo que tenga éxito producirá un
ingreso de US$600.000 dólares.
a) ¿Cuál es la probabilidad que uno o más pozos sean productivos (exitosos)?
b) ¿Cuál es el número esperado de pozos productivos?
c) ¿Cuál es la ganancia esperada?
d) ¿Cuál es la ganancia si solamente un pozo resulta productivo?
12. Sea X la variable aleatoria “número de veces que aparece el 6” cuando se lanzan setenta y
dos dados legales. Determine el valor esperado de la variable aleatoria X 2 .
13. De experiencia pasada se sabe que cierta cirugía tiene una probabilidad del 90 % ser exitosa.
La cirugía se va a realizar en 30 pacientes. Sea X la variable aleatoria “número de cirugías
exitosas de las 30 realizadas.
a) Escriba la función masa de probabilidad de X.
b) ¿Cuál es la probabilidad de que la cirugía falle en el 20 % de los casos.
c) ¿Cuál es la probabilidad de que la cirugía sea exitosa en por lo menos el 75 % del total
de cirugías realizadas?.
14. Cuando un guepardo ataca a un impala en la estepa, tiene 60 % de probabilidad de cazarlo.
Dos guepardos apuntan de forma independiente al mismo impala. Encuentre la probabilidad
de que
a) ninguno de ellos atrape al impala.
b) solamente uno de los guerpardos atrape al impala.
c) ambos guepardos atrapen al impala.
15. En una sesión de identificación, a 6 testigos se les pide identificar al asesino entre 4 posibles
sujetos (uno de los cuales es el asesino). Si cada uno de los testigos elige al azar a uno de
los sujetos, determine la probabilidad de que
a) el asesino no sea seleccionado.
b) el asesino sea seleccionado por al menos uno de los testigos.
c) el asesino sea seleccionado a lo más por tres.
16. La probabilidad de hacer una venta, por linea telefónico, por parte de un vendedor de
televentas, es del 15 %. Hallar la probabilidad de que
a) ninguna venta sea hecha en 10 llamadas.
b) cuatro ventas sean hechas en 20 llamadas.
c) por lo menos ocho ventas sean hechas en 50 llamadas.
17. Una fabrica produce componentes, de las cuales se sabe que el 2 % son defectuosas. Las
componentes se empacan en cajas que contienen cien componentes. Se elige una caja al
azar.
a) ¿Cuál es la probabilidad de que no se encuentren unidades defectuosas?
b) ¿Cuál es la probabilidad de que se encuentren a lo más tres unidades defectuosas?
74 Modelos discretos
Definición 4.5
Un modelo geométrico se caracteriza por la repetición de un ensayo Bernoulli, en las mismas
condiciones, hasta alcanzar un éxito.
Definición 4.6
Sea X la variable aleatoria que mide el número de veces que se repite un ensayo Bernoulli
hasta alcanzar éxito por primera vez. El rango de este variable es Rank(X) = {1, 2, . . .}
1
X Valor esperado: E[X] =
p
q
X Varianza: Var(X) = 2
p
pet
X FGM: MX (t) =
1 − qet
76 Modelos discretos
4.8
La probabilidad que un bit transmitido por un canal de transmisión digital sea recibido
erradamente es 0.1. Suponga que las transmisiones son eventos independientes. Sea X la
variable aleatoria “número de bits transmitidos hasta que el primer bit errado ocurra”. Cuántos
bits, en promedio son transmitidos por el canal hasta que ocurra el primer error?
Observemos que
∞ ∞ ∞
1
P(X > k) = ∑ q j−1 p = p ∑ q j+k = qk p ∑ q j = qk p = qk
j=k+1 j=0 j=0 1−q
4.4 Modelo geométrico 77
P(X > s + t)
P(X > s + t|X > s) =
P(X > s)
qs+t
=
qs
= qt
= P(X > t)
Teorema 4.2
Sea X una variable aleatoria discreta con rango {1, 2, . . .} y tal que para todo i, j ∈ Z+ X
verifica:
es decir
P(X = 1) + P(X > 1) = 1 ⇒ P(X = 1) + y = 1 ⇒ P(X = 1) = 1 − y
Entonces
P(X = k) = P(X > k − 1) − P(X > k) = yk−1 − yk = yk−1 (1 − y)
esto significa que la función masa de probabilidad de X es un modelo geométrico, por tanto
X ∼ geom(y)
78 Modelos discretos
La variable aleatoria X se define como “el número de fracasos previos a la ocurrencia del primer
éxito”.
Proposición 4.2
Si X es la variable aleatoria definida como “el número de fracasos previos a la ocurrencia del
primer éxito”, entonces:
a) La función masa de probabilidad es:
P[X = n] = qn p, n = 0, 1, 2, . . .
q
b) E[X] = p
q2 q
c) Var[X] = +
p2 p
Ejercicios 4.2
1. Una empresa de pedidos por correo envía una carta a sus clientes. La probabilidad de que
un cliente elegido al azar conteste a esa carta es de p = 15 %. Hallar:
a) La distribución de probabilidad del número X de cartas que debe enviar hasta recibir
una respuesta.
b) La esperanza y varianza de X
2. La probabilidad de una alineación óptica con éxito en el montaje de un producto óptico,
según especificaciones para su almacenamiento, es del 80 %. Suponga que los intentos de
montaje son independientes.
a) ¿Cuál es la probabilidad de que la alineación con éxito se produzca por primera vez en
el quinto ensayo?
b) ¿Cuál es la probabilidad de que la primera alineación con éxito requiera como mínimo
cuatro intentos?
c) ¿Cuál es la probabilidad de que la primera alineación con éxito requiera a lo menos
cuatro y a lo más 6 intentos?
d) ¿Cuántos intentos se espera realizar para lograr el primer éxito?
e) Calcular la desviación estándar del número de intentos hasta lograr éxito en la alinea-
ción.
3. Un científico inocula varias ratas, una a la vez, con un germen de cierta enfermedad hasta
lograr una que la haya contraído. Si la probabilidad de contraer la enfermedad es 51 ,
a) ¿Cuál es la probabilidad de que se requieran 8 inoculaciones hasta encontrar una rata
que haya contraído la enfermedad?
b) ¿Cuál es la probabilidad de que por primera vez a lo más en la cuarta inoculación se
encuentre una rata que haya contraído la enfermedad?
c) ¿Cuál es la probabilidad de que se requiera como mínimo cinco inoculaciones para
encontrar la primera rata que haya contraído la enfermedad?
d) ¿Cuál es la probabilidad de que se requiera a lo menos cuatro y a lo más seis inocula-
4.4 Modelo geométrico 79
funcionamiento?
b) ¿Cuál es la probabilidad de que el equipo falle después del tercer día de funcionamien-
to? ¿Se puede estar tranquilo en la empresa al observar este resultado?
c) ¿Cuál es el número medio de días de buen funcionamiento hasta que el equipo falle?
10. En una operación de llenado automático, una báscula electrónica detiene la línea de fa-
bricación después de detectar un paquete de peso inferior al normal. Supongamos que la
probabilidad de que se produzca un paquete de bajo peso es de 0.001 y que el relleno de
cada uno es independiente.
a) ¿Cuál es el número medio de rellenos antes de que se detenga la línea de producción?
b) ¿Cuál es la desviación estándar del número de rellenos antes de que se detenga la línea
de producción?
11. La probabilidad de que una persona, que vive en un determinado lugar de la ciudad, sea
propietaria de un perro se estima en 0, 3. Encuentre la probabilidad de que una persona
entrevistada al azar en décimo lugar sea la primera propietaria de un perro en esa zona de la
ciudad
12. La probabilidad de que un alumno pase la prueba escrita para certificarse en control elec-
trónico, después de haber seguido un curso, es de 0, 7. Encuentre la probabilidad de que el
estudiante pase la prueba
a) en el tercer intento.
b) antes del cuarto intento
13. En el control de equipaje de un aeropuerto se sabe que el 3 % de las personas revisadas
tienen objetos ilegales en su equipaje.
optIon ¿Cuál es la probabilidad de que una cadena de 15 personas pase el control con éxito
antes de que pase un individuo con un objeto cuestionable?
optIIon ¿Cuál es el número esperado de individuos que pasan el control en una fila antes de
que un individuo detenga el proceso?
14. Suponga que la longitud de un carácter (en bits) es una distribución geométrica con paráme-
tro p. Suponga, además, que la longitud de caracteres son variables aleatorias independientes.
Cuál es la distribución del número total de los bits que forman un mensaje de k caracteres
aleatorios?
15. Mil doscientos huevos, de los cuales doscientos están con la cáscara quebrada, se distribuyen
aleatoriamente en cien cubetas para huevos, cada una conteniendo doce huevos. Estas cubetas
son vendidas a un restaurante. Cuántas cubetas deberían esperarse que el chef del restaurante
abra antes de hallar una cubeta sin huevos rotos?
16. 25 % de los automoviles exhibidos en un concesionario son automáticos. Un vendedor del
concesionario muestra los vehículos uno a continuación del otro, a potenciales compradores,
en forma aleatoria. Sea X la variable aleatoria “número de autos automáticos” que un
potencial comprador verá antes del primer vehiculo mecánico.
a) Cuál es la función masa de probabilidad de X?
b) Cuál es la función masa de probabilidad de la variable aleatoria Y = X + 1?
17. Como parte de un proceso de selección de personal para operar maquinaria de precisión, a
cada candidato se le realiza una prueba clínica de presión arterial. Sea X la variable aleatoria
“número de candidatos probados clínicamente hasta que la primera persona con presión
4.5 Modelo binomial negativo 81
arterial alta aparece. El valor esperado de X es 12.5. Calcule la probabilidad que la sexta
persona probada clínicamente sea la primera candidata con presión arterial alta.
18. Un laboratorio computacional consistente de veinte computadores fue atacado por un virus
informático. Dicho virus ingresa a un computador con probabilidad 0.40, independientemen-
te del resto de los computadores. La ingeniera administradora responsable del laboratorio
examina cada computador, uno a uno para determinar si fue o no infectado por el virus.
Cuál es la probabilidad de que la ingeniera tenga que examinar al menos seis computadores
para hallar el primero infectado.
19. Una prueba de resistencia de la soldadura implica cargar juntas soldadas hasta que se
produzca una fractura. Para cierto tipo de soldadura, el 80 % de las fracturas ocurren en la
soldadura, mientras que el otro 20 % ocurren en la viga. Se prueban varias soldaduras y las
pruebas son independientes. Hallar la probabilidad de que se requieran por lo menos cinco
pruebas hasta obtener la primera viga fracturada.
20. Una red de laboratorio que consta de un cluster de 50 computadoras fue atacada por un
virus informático. Este virus ingresa a cada computadora con probabilidad 0.3, indepen-
dientemente de otras computadoras. El técnico responsable de la salade cómputo revisa
las computadoras del laboratorio, una tras otra, para ver si estaban infectadas por el virus.
¿Cuál es la probabilidad de que tenga que no tenga que probar más de 20 computadoras
para encontrar la primera computadora infectada?
21. Un estudiante travieso quiere entrar en un archivo de computadora, que está protegido con
contraseña. Suponga que que hay n contraseñas, solo una de las cuales es correcta, y que el
estudiante intenta contraseñas posibles en un orden aleatorio. Sea N el “número de pruebas
requeridas para entrar en el archivo”. Determinar la función masade probabilidad de N.
22. Los componentes informáticos idénticos se envían en cajas de 5. Alrededor del 15 % de los
componentes son defectuosos. Las cajas se prueban en un orden aleatorio.
a) ¿Cuál es la probabilidad de que una caja seleccionada al azar solo tenga componentes
no defectuosos?
b) ¿Cuál es la probabilidad de que al menos 8 de las 10 cajas seleccionadas al azar tengan
solo componentes defectuosos? componentes?
c) ¿Cuál es la distribución del número de cajas probadas hasta que se encuentra una caja
sin componentes defectuosos?
Definición 4.8
Un modelo binomial negativo consiste en repetir un ensayo Bernoulli, bajo las mismas
condiciones en cada repetición, hasta alcanzar r éxitos.
Definición 4.9
La variable aleatoria X definida por: “número de repeticiones hasta alcanzar r éxitos” en un
modelo binomial, se distribuye binomial negativa, X ∼ BN(r, p),
82 Modelos discretos
(
k−1
r−1 pr qk−r , para k = r, r + 1, . . .
P(X = k) :=
0, en los demás casos
r
X Valor esperado: E[X] =
p
rq
X Varianza: Var[X] = 2
p
Funciones en el programa R
A continuación referenciamos las funciones más importantes del modelo Binomial Negativa que el
programa R tiene implementadas:
Función Características
dnbinom(x,size,prob,mu,log=F) Devuelve el valor de la fmp
pnbinom(q,size,prob,mu,lower.tail=T,log.p=F) Devuelve el valor de la FD
qnbinom(p,size,prob,mu, lower.tail=T,log.p=F) Devuelve el cuantil q
rnbinom(n,size,prob,mu) Devuelve vector aleatorio binomiales negativos
X ∼ BN(r = 3, p = 0.7)
se muestra a continuación:
4.5 Modelo binomial negativo 83
4.9
Observemos que el problema establece como fijo el número de perforaciones exitosas (2) y como
variable el número de ensayos (las perforaciones), por tanto estamos en presencia de un modelo
binomial negativo.
Definimos la variable aleatoria X como “número de perforaciones necesarias para obtener exacta-
mente 2 hallazgos de petróleo”, en consecuencia tenemos que X ∼ BN(r = 2; p = 0.2), cuya fmp
es:
k−1
P(X = k) = (0.2)2 (0.8)k−2
2−1
84 Modelos discretos
es decir
4.10
Consideremos la variable aleatoria X definida por “número de pacientes sin reacción negativa al
fármaco contra el dolor previos al décimo paciente con reacción negativa al fármaco”, entonces
X ∼ BN(r = 5, p = 0.05)
por tanto el número esperado de pacientes, en la unidad, que no muestran reacción adversa al fármaco
previos a que se presente el paciente décimo con una reacción negativa al fármaco es:
10 × 0.95
= 190
0.05
Ejercicios 4.3
1. Tres personas lanzan, cada una, una moneda legal. De los tres el que obtenga un resultado
distinto invita a los tres un café. En caso de que las monedas muestren el mismo resultado,
vuelven a lanzar hasta obtener el desempate. Halle la probabilidad de que se requieran
menos de cuatro lanzamientos para terminar.
2. Un médico que se especializa en cirugía de mano derecha experimenta con ratones hasta
lograr un resultado óptimo en la cirugía (de acuerdo con protocolos médicos y éticos). En
dicho tipo de experimentación la probabilidad de alcanzar un resultado óptimo es del 25 %,
halle la probabilidad de que se requiera experimentar con ocho ratones.
3. Un estudio de inventario determina que, en promedio, las demandas de un artículo particular
en un almacén son hechas cinco veces por día Determine la probabilidad de que en un
determinado día este artículo sea solicitado:
a) más de diez veces.
b) ninguna vez.
c) exactamente cinco veces.
4. De acuerdo con estudios de Medicina Legal, cerca del 30 % de las personas que son hurtadas
diariamente han sido afectadas con alguna sustancia que inhibe su voluntad. Asumiendo
que este estudio es válido, halle la probabilidad de que en un día dado la quinta persona que
es llevada a Medicina Legal por hurto sea
a) la primera que ha sido drogada.
b) la tercera que ha sido drogada.
c) por cualquier otra causa distinta a ser drogada.
5. La probabilidad de que un estudiante obtenga un score de 80 puntos en la prueba TOEFL,
con una preparación laxa, es de 0.40. Si las condiciones de preparación se conservan,
determine la probabilidad de que el estudiante obtenga un puntaje de 80 puntos en esta
prueba:
a) en el primer intento.
b) en el quinto intento.
c) en el cuarto intento.
6. Una zona de descanso en carretera tienen una capacidad para tres vehículos (de un solo eje).
Determine la probabilidad de que esta zona esté llena, en un intervalo de tiempo de diez
minutos. Por estadísticas de movilidad de esta carretera se tiene estimado que seis carros
de un solo eje pasan por este espacio de descanso en lapsos de tiempo de diez minutos y,
que en promedio un 80 % de todos los autos de un eje desearán parquear en dicha zona de
descanso.
7. Una moneda cargada es tal que cara sale el triple de veces que sello. Cuál es la probabilidad
que el quinto sello observado se obtenga en el décimo lanzamiento?
86 Modelos discretos
19. Un cierto tipo de misil tiene una probabilidad de falla de 0.02. Sea N la v.a. “número de
lanzamiento hasta el cuarto lanzamiento con falla”.
a) Encuentre la función masa de probabilidad de N.
b) Encuentra la media y la varianza de N.
c) Encuentre la probabilidad de que haya al menos 4 fallas en los primeros 200 lanza-
mientos.
20. Un examen de señales consta de 20 preguntas tipo test y se conoce de experiencias anteriores
que un alumno tiene probabilidad 0.7 de contestar bien cada pregunta. Hallar:
a) La probabilidad de que la primera pregunta que contesta bien sea la cuarta.
b) Sabiendo que para aprobar el examen es necesario contestar bien a 12 preguntas, ¿cuál
es la probabilidad de que apruebe al contestar la pregunta duodécima?
21. De acuerdo con la revista Chess Life, 40 % de los grandes maestros de ajedrez del mundo
consideran a Garry Kaspárov como el mejor ajedrecista de todos los tiempos. Si se le pregun-
ta varios grandes maestros de ajedrez su opinión a este respecto, encuentre la probabilidad
de que el octavo a quien se le pregunte sea el cuarto que considera a Kaspárov el mejor
ajedrecista del mundo.
22. Según el gerente de la compañía Avianca, 20 % de las personas que hacen reservaciones
por teléfono para un vuelo, finalmente no acudirán a comprar el boleto. Determine la
probabilidad de que séptimo individuo que hace reservación por teléfono, un día cualquiera,
sea el segundo que no se presentará a comprar el boleto.
23. La mayoría de los psiquiatras concuerdan en que aproximadamente 60 % de las personas
que sufren una crisis depresiva mayor se recuperan con ayuda profesional. ¿Cuál es la
probabilidad de que la sexta persona con crisis depresiva mayor, que visita a un psiquiatra,
sea la tercera que se logre recuperar?
4.11
Una tienda tiene 20 guitarras en existencia, pero 3 son defectuosas (leves errores en un par de
trastes); las guitarras son del mismo tipo, las diferencia solo el color y algunos adornos de
manera que a los ojos de un comprador solo son distinguibles por el gusto y en consecuencia
cada guitarra es igualmente probable de ser elegida. Alejandro compra 5 guitarras de este lote.
Encuentre la probabilidad de que Alejandro haya comprado 2 guitarras defectuosas.
II ) Casos favorables (número de grupos de 5 guitarras que pueden seleccioanrse del lote de 20
guitarras, con 2 son defectuosas y 3 buenas):
X Selección de las 2 guitarras defectuosas:
3
2
Definición 4.11
La variable aleatoria X se distribuye hipergeométricamente, en simbolos X ∼ Hg(N, r; n), si y
solo si:
I ) X mide “el número de éxitos en la muestra de tamaño n” seleccionada al azar y sin
repetición de una población finita de tamaño N con r elementos denominados éxitos y
N − r denominados fracasos.
II ) La función masa de probabilidad de X está dada por.
N−r r
n−k k
P(X = k) := N
; k = 0, 1, 2, . . . , n, r ≥ n
n
Funciones en el programa R
A continuación referenciamos las funciones más importantes del modelo Hipergeométrico que el
programa R tiene implementadas:
Función Características
dhyper(x,m,n,k,log=F) Devuelve el valor de la fmp
phyper(q,m,n,k,lower.tail=T,log.p=F) Devuelve el valor de la FD
qhyper(p,m,n,k,lower.tail=T,log.p=F) Devuelve el cuantil q
rhyper(nn,m,n,k) Devuelve vector aleatorio hipergeométrico
Donde:
X x, q: Vector de cuantiles. Corresponde al número de particulares en la muestra.
X m: Selección aleatoria particular.
X n: El número total de la población menos la selección aleatoria particular. n = N − m.
X n: El número de la selección a evaluar.
X prob: Probabilidad.
X nn: Número de observaciones.
X log, log.p: Parámetro booleano, si es TRUE, las probabilidades p son devuelatas como log(p).
X lower.tail: Parámetro booleano, si es TRUE (por defecto), las probabilidades son P[X ≤ x], de
lo contrario son P[X > x].
A continuación una gráfica de una distribución hipergeométrica en la cual se tiene una población de
N = 20 bolas, divididas en m = 8 blancas y n = 12 negras. Se saca una muestra de tamaño k = 4
bolas, en forma aleatoria.
90 Modelos discretos
El modelo binomial y el modelo hipergeométrico están relacionados en el sentido que ambos están
sustentados en pruebas Bernoulli, la diferencia es que mientras en el modelo binomial los ensayos
son independientes y la probabilidad de éxito se mantiene estable (constante) en cada repetición, en
el modelo hipergeométrico los ensayos son dependientes y la probabilidad de éxito va cambiando.
Sin embargo, cuando el tamaño de la población, de la cual se muestrea, es grande y el tamaño de la
muestra es pequeño entonces es posible aproximar el modelo hipergeométrico mediante el modelo
binomial. A continuación el teorema que establece esta aproximación.
Teorema 4.3
Aproximación Binomial al modelo hipergeométrico Supongamos que N → ∞, r → ∞, de
r
manera que → ∞, entonces
N
Hg(N, r; n) ←→ Bin(n, p)
es decir
N−r r
n−k k n k
P(X = k) = N
−→ P(X = k) = p (1 − p)n−k
n
k
r
donde p :=
N
4.6 MODELO HIPERGEOMÉTRICO 91
4.12
Luego
90 10
3 1424
a) P(X = 1) = 100
1 = ≈ 0.3.
4
4753
4 × 10
b) E[X] = = 0.4.
100
90 96
c) Var[X] = 0.4 × × ≈ 0.36 por tanto σX = 0.60.
100 99
Ejercicios 4.4
1. Sea X una distribución hipergeométrica con N = 11, r = 6 y n = 7. Calcular
a) P(X = 4)
b) P(X = 5)
c) P(X ≥ 4)
2. Una delegación consiste de 8 hinchas del equipo A y 7 hinchas del equipo B. Se forma un
comité de cinco miembros, seleccionados al azar de entre todas las quince personas que
conforman la delegación. Considere la variable aleatoria “número de miembros del comité
que son hinchas del equipo B”.
a) Halle la fmp de la variable aleatoria.
b) Trace la gráfica de la fmp.
c) Determine la media y la varianza de la variable aleatoria.
3. Cincuenta motocicletas de bajo cilindraje han sido devueltas al distribuidor debido al
a presencia de un ruido oscilante agudo cuando la motocileta está prendida y detenida.
Supongamos que 20 de estas 50 motos tienen discos defectuosos y las otros 30 tienen
problemas menores. Si se examinan al azar 10 de estas 50 motos. Considere la variable
aleatoria “número entre las 10 examinadas que tienen disco defectuoso”.
a) Halle la fmp de esta variable aleatoria.
92 Modelos discretos
Se seleccionan aleatoriamente, sin reemplazo, cinco cartas del mazo (previamente barajado)
de poker.
a) Cuál es la probabilidad que tres de estas sean figuras (J, Q, K)?
b) Cuál es la probabilidad de obtener un Full?
c) Cuál es la probabilidad de obtener un Poker?
d) Cuál es la probabilidad de obtener un Trio?
4.6 MODELO HIPERGEOMÉTRICO 93
presenta problemas de frenos. Si se seleccionad cinco vehiculos al azar para hacerles una
prueba tecno-mecánica, ¿cuál es la probabilidad de que dos de los vehiculos probados tenga
problemas de frenos?
22. En una oficina gubernamental de una ciudad laboran cuarenta empleados públicos, de los
cuales quince son corruptos y el resto no. Se eligen ocho empleados de esta oficina para
hacerle una prueba de corrupción, ¿cuál es la probabilidad de que todos sean corruptos?
Proposición 4.3
La distribución Poisson es un caso límite de la distribución binomial que ocurren cuando el
número de ensayos Bernoulli, n, se incrementa indefinidamente mientras el producto λ = np,
que corresponde al valor esperado del número de éxitos en las repeticiones del ensayo de
Bernoulli, permanece constante.
es decir
λ k n(n − 1)(n − 2) . . . (n − k + 1) λ n−k
P(X = k) = 1−
k! nk n
reagrupando términos obtenemos
λ nλk n
n−1 n−k+1 1
P(X = k) = 1 − ×
n k! n n n λ k
1−
n
como:
X
λ n
lı́m 1 − = e−λ
n→∞ n
X
λ k
lı́m 1 − =1
n→∞ n
X
n− j
∀ j = 0, 1, . . . , k − 1 : lı́m = 1,
n→∞ n
e−λ λ k
P(X = k) = , para k = 0, 1, . . .
k!
Funciones en el programa R
A continuación referenciamos las funciones más importantes del modelo Poisson que el programa R
tiene implementadas:
Función Características
dpois(x,λ ,log=F) Devuelve el valor de la fmp
ppois(q,λ ,lower.tail=T,log.p=F) Devuelve el valor de la FD
qpois(p,λ ,lower.tail=T,log.p=F) Devuelve el cuantil q
rpois(n,λ ) Devuelve vector aleatorio hipergeométrico
Donde:
X x: Vector de cuantiles.
X q: Vector de cuantiles.
X p: Vector de probabilidades.
X n: El número valores aleatorios a devolver.
X prob: Probabilidad de éxito en cada ensayo.
X λ : Vector de medias (valor no negativo).
X log, log.p: Parámetro booleano, si es TRUE, las probabilidades p son devueltas como log(p).
X lower.tail: Parámetro booleano, si es TRUE (por defecto), las probabilidades son P[X ≤ x], de
lo contrario son P[X > x].
La tasa λ corresponde al número de eventos que ocurren por unidad de tiempo o unidad de espacio
(longitud, área, volumen). Una presentación más general del modelo aleatorio Poisson será dada
posteriormente, sin embargo para propósitos pedagógicos es conveniente tener en cuenta la siguiente
presentación.
Definición 4.14
Un proceso de conteo es un proceso aleatorio {N(t) : t ≥ 0}, donde N(t) representa el
“número total de eventos que ocurren en el intervalo [0,t]”, que satisface los siguientes
axiomas:
I ) N(t) ≥ 0
II ) N(t) es de valor entero
III ) Si s < t entonces N(s) ≤ N(t)
IV ) Para s < t, N(t) − N(s) representa “el número de eventos que han ocurrido en el
intervalo (s,t]
hasta t, es decir N(t), es independiente del número de eventos que ocurre entre t y t + s, es decir
N(t + s) − N(t).
Un proceso de conteo se dice estacionario sí la distribución de probabilidades es la misma en todo
intervalo de igual longitud, es decir el número de eventos que ocurre en el intervalo (s,t] es igual, en
probabilidad, al número de eventos en el intervalo (s + h,t + h] para todo h > 0.
Definición 4.15
El proceso de conteo {N(t) : t ≥ 0} es un proceso de Poisson, con tasa λ > 0 por unidad de
tiempo, si y solamente si {N(t) : t ≥ 0} satisface los siguientes axiomas
I ) N(0) = 0
II ) {N(t) : t ≥ 0} es de incrementos independientes.
III ) {N(t) : t ≥ 0} es de incrementos estacionario, y satisface:
(λt)n
P(N(t + h) − N(h) = n) = P(N(t) = 0) = e−λt , n = 0, 1, 2, . . .
n!
4.13
Supongamos que se conoce que los nacimientos en una clínica ocurren aleatoriamente a una
tasa promedio de 1.8 nacimientos por hora. Determinar la probabilidad de que se observen 5
nacimiento en un intervalo de tiempo de 2 horas.
Para un intervalo de dos horas la tasa de nacimiento será de 3.8 nacimientos por 2 horas. De esta
manera consideramos la variable aleatoria N definida como “Número de nacimientos en un periodo
de dos horas”. Asumimos que este proceso de nacimientos es modelado según una distribución
Poisson, es decir
N ∼ Poi(λ = 3.6)
4.14
La tasa de atención es de 20 pacientes por intervalos de 4 horas, esto significa que en periodos de 2
horas atenderán 10 pacientes, por tanto la tasa de atención en un periodo de 40 minutos ( 13 de hora)
será de 10
3 pacientes por periodo de 40 minutos.
100 Modelos discretos
10 ( 10
3)
n
P(N = n) = e− 3
n!
Entonces la probabilidad de que en un periodo de 40 minutos atiendan menos de 3 pacientes es
P(N < 3) equivalente a P(N ≤ 2), luego
( 10 2 10
10
3)
P(N ≤ 2) = P(N = 2) + P(N = 1) + P(N = 0) = e− 3 + 3 +1 ≈
2! 1!
entonces
[P(N ≤ 2) ≈ 0.35277
4.15
Si para una distribución Poisson con fmp dada por f (k) := P(X = k) se verifica
λk
Como P(X = k) = e−λ , entonces
k!
λ 2 −λ
f (0) = e−λ , f (1) = λ e−λ , f (2) = e
2
λ 2 −λ
e + 6e−λ = 4λ e−λ
2
√ √
σX = 2; σX = 6
4.7 MODELO POISSON 101
4.16
En una gran ciudad 5 de cada mil habitantes, en promedio, tienen sangre tipo AB− . Si 200
donantes de sangre, son tomados aleatoriamente. Halle la probabilidad de que por lo menos
10 tengan grupo sanguíneo AB−
Cada donante de sangre es un ensayo Bernoulli: “o bien tiene grupo sanguíneo AB− o bien no lo
tiene” por tanto estamos en presencia de un modelo binomial con parámetro n = 200 y p = 0.005.
Sea X la variable aleatoria “número de donantes con grupo sanguíneo AB− , entonces X ∼ Bin(n =
200, p = 0.005).
Por tanto debemos calcular: P(X ≥ 10) que es equivalente a:
9
200
1 − P(X ≤ 9) = 1 − ∑ (0.005)k (0.995)200−k ≈ 9.2559 × 10−8
k=0 k
Si empleamos el modelo Poisson, como una aproximación al modelo binomial, con λ = 200 ×
0.005 = 1 entonces obtenemos
9
e−1
P(X ≥ 10) = 1 − P(X ≤ 9) = ∑ ≈ 1.11424 × 10−7
k=0 k!
Cuál es el error porcentual que se comete con esta aproximación?
Ejercicios 4.5
1. Una empresa fabricante de automóviles sabe de su proceso de control de calidad que existe
una falla en el sistema de frenos de cierto modelo. La falla puede causar, en raras ocasiones,
un siniestro cuando los autos de este modelo exceden cierta velocidad (alta). De acuerdo
con el estudio de control de calidad se estableció que la distribución del número de carros
por año que experimentarán siniestros (como consecuencia de falla por el mecanismo de
frenos) es Poisson con tasa λ = 5.
a) Determine las unidades de λ .
b) Defina la variable aleatoria relevante.
c) Determine la probabilidad de que a lo más tres carros por año experimenten un siniestro
de este tipo.
d) Determine la probabilidad que por lo menos tres de estos por año experimenten un
siniestro de este tipo.
2. El número de usuarios que llega por hora a cierta unidad de salud sigue una distribución de
Poisson con una media de 7 usuarios por hora.
a) Defina la variable aleatoria de interés y escriba su fmp.
b) Determine la probabilidad que más de 20 usuarios acudan por atención a esta unidad
de saludo en un lapso de 2 horas.
c) Determine el promedio de usuarios que llegará por atención a esta unidad en un
periodo de 90 minutos.
3. Pequeñas aeronaves arriban a un aeropuerto de acuerdo con un proceso de Poisson, a una
tasa de 6 aeronaves por hora.
102 Modelos discretos
Halle la varianza de X.
19. Los cambios en los procedimientos de planificación de aeropuertos requieren considera-
bles planificaciones. Las tasas de llegada de las aeronaves son factores importantes que
deben tenerse en cuenta. Supongamos que las aeronaves pequeñas llegan a un aeropuerto
determinado, de acuerdo con un proceso de Poisson, a razón de seis aviones por hora.
a) ¿Cuál es la probabilidad de que exactamente cuatro aviones pequeños lleguen durante
un período de una hora?
104 Modelos discretos
5 — Modelos continuos
En este capitulo abordaremos algunos modelos de probabilidad para variables aleatorias continuas.
X Esperanza matemática
a+b
E[X] = µX =
2
X Varianza
(b − a)2
Var(X) = σX2 =
12
X Función generadora de Momentos
rb ra
e − e , para r 6= 0
MX (r) := E(erX ) = r(b − a)
para r = 0
1,
5.1
Sea Y una variable aleatoria uniformemente distribuida en el intervalo (0, 5), calcular la
probabilidad que las raices de la ecuación cuadrática 4x2 + 4xY + Y + 2 = 0 sean números
complejos.
Calculamos la probabilidad P((4Y )2 − 16(Y + 2) < 0), es decir P(16Y 2 − 16Y − 32 < 0)
2
P(Y 2 −Y − 2 < 0) ⇒ P((Y − 2)(Y + 1) < 0) ⇒ P(−1 < Y < 2) = P(0 < Y < 2) =
5
5.1 Modelo uniforme 107
5.2
luego
0.1
a) P(X > 1) = 0.2 = 12 , es decir el 50 %.
1.1−x
b) Hallar x tal que P(X > x) = 0.2 entonces 0.2 = 0.2 entonces x = 1.06 mm, o bien
Z 1.1 1.1
5dy = 5y = 0.2 ⇒ 1.1 − x = 0.25 ⇒ x = 1.06 mm
x x
Ejercicios 5.1
1. Sea X una variable uniforme en el intervalo [0, 10]. Calcular
1
P X+ ≥7
X
e−x
fX (x) = , para − ∞ < x < ∞
(1 + e−x )2
x2 + 2θ x + 1 = 0
tenga por lo menos una solución real, si el coeficiente θ es un número real que se elige al
azar de manera uniforme del intervalo (−4, 4)
108 Modelos continuos
x2 + θ x + 1 = 0
tenga por lo menos una solución real, si el coeficiente θ es un número real que se elige al
azar de manera uniforme del intervalo (−3, 4]
22. Sea α > 0 un número real, X ∼ U(−α, α). Si P(X < 12 ) = 10 7
, determine el valor de α y
1 7
halle P(|X + 5 | < 10 )
(
β e−β x , si x > 0
fX (x) :=
0, otro caso
110 Modelos continuos
X Función de sobrevivencia:
(
e−β x si x > 0
SX (x) := P(X > x) = 1 − FX (x) = 1 − (1 − e−β x ) =
0 otro caso
X Esperanza matemática
1
E[X] = µX =
β
X Varianza
1
Var(X) = σX2 =
β2
β
MX (r) := E(erX ) = , para 0 ≤ r < β
β −r
5.2 Modelo exponencial 111
Proposición 5.1
Si X ∼ exp(β ) entonces X no tiene memoria.
En efecto
P(X > s + t; X > s)
P(X > s + t|X > s) =
P(X > s)
P(X > s + t)
=
P(X > s)
e−β (s+t)
=
e−β s
−βt
=e
= P(X > t)
Proposición 5.2
Sea X una variable aleatoria continua no negativa tal que P(X > s + t) = P(X > s)P(X > t),
para todo s,t > 0, entonces X es un modelo exponencial.
Denotemos con S la función de sobrevivencia de X, es decir S(x) = P(X > x); recordemos que S
satisface:
112 Modelos continuos
Ejercicios 5.2
1. El tiempo de falla (en horas) de ventiladores para computadores fijos se modela mediante
una distribución exponencial con tiempo medio de duración 3333, 3.
a) Qué proporción de ventiladores durarará al menos 10000 horas?
b) Qué proporción de ventiladores durará por mucho 7000 horas?
2. El tiempo entre la llegada de dos mensajes electrónicos a su computador personal es
exponencialmente distribuido con una media de 2 horas.
a) Cuál es la probabilidad que usted no reciba un mensaje electrónico en su PC durante
un periodo de 2 horas?
b) Si usted no ha recibido ningún mensaje electrónico en su PC en las últimas 3 horas,
cuál es la probabilidad de que no le llegue ningún mensaje en las siguientes 2 horas?
c) Cuál es el tiempo de espera entre su quinto mensaje elecrónico y su sexto mensaje
electrónico?
3. El tiempo entre llegadas de taxis a un centro comercial es exponencialmente distribuido con
un tiempo medio de 10 minutos.
a) Cuál es la probabilidad que usted tenga que esperar por un taxi por lo menos una hora?
b) Si usted ha estado esperando por una hora, por un taxi, cuál es la probabilidad llegue
5.2 Modelo exponencial 113
P(X > λ ); P(X > 2λ ); P(X > 3λ ); P(X > 4λ ); . . . P(X > mλ )
para m ∈ Z+ .
b) Cómo las probabilidades del numeral anterior dependen de λ ?
c) Si el valor mediano de esta variable aleatoria es 21 , cuál es el valor de λ ?
d) Si P(4 < X ≤ 8) = e−1e2
, cuál es el valor de λ ?
5. Sean X y Y variables aleatorias independientes estadisticamente, con media β1 y β2 respec-
tivamente.
a) Determinar la función de densidad de probabilidad de la variable aleatoria Z :=
min{X,Y }
b) Determinar la función de densidad de probabilidad de la variable aleatoria Z :=
Max{X,Y }
c) Determinar la función de densidad de probabilidad de la variable aleatoria Z := X +Y
d) Determinar la función de densidad de probabilidad de la variable aleatoria Z :=
(1 − θ )X + θY , para 0 ≤ θ ≤ 1
6. El tiempo de falla en meses, X, de tubos de luz alógena producidos en dos plantas industriales
A y B obedecen, respectivamente, a las siguientes funciones distribución:
7. La variable aleatoria T mide el tiempo, en minutos, entre dos llamadas consecutivas que
llegan a la oficina PQR de una EPS. La fdp de T es
(
1 −0.1t
e , t >0
fT (t) = 10
0, en otro caso
Definición 5.2
Sea α > 0 un número real. La función gamma de argumento α se define por la integral
impropia
Z ∞
Γ(α) := t α−1 e−t dt
0
Veamos que la función está bien definida, es decir demostremos que la integral es convergente.
5.3 Modelo gamma 115
Proposición 5.3
La integral
Z ∞
t α−1 e−t dt
0
Observemos que
Z ∞ Z 1 Z ∞
α−1 −t α−1 −t
t e dt = t e dt + t α−1 e−t dt
0 0 1
tα
Z Z
α−1 −t
t e dt ≤ t α−1 dt =
α
Consideremos dos casos, respecto de α:
a) Caso 1: α ≥ 1, entonces
t α 1 1
Z 1
α−1 −t
t e dt ≤ = < +∞
0 α 0 α
b) Caso 2: 0 < α < 1, entonces α − 1 < 0 y por tanto la función h(t) = t α−1 tiene una
discontinuidad en el intervalo [0, 1], entonces
t α 1
Z 1 Z 1
α−1 α−1 1 aα 1
t dt = lı́m+ t dt = lı́m+ = lı́m+ − = < +∞
0 a→0 a a→0 α a a→0 α α α
Proposición 5.4
La función Gamma tiene las siguientes propiedades:
a) Γ(α + 1) = αΓ(α)
+1) = n!, para todo n ∈ N
b) Γ(n
1 √
c) Γ = π
2
Ejercicios 5.3
1. Llamadas llegan a un call center siguiendo una distribución de Poisson con una media de 5
llamadas por minuto.
a) Determine el modelo aleatorio (distribución) que mide el tiempo hasta la décima
llamada.
b) Halle el tiempo medio hasta la décima llamada.
c) Determine el tiempo medio entre la novena y la décima llamada.
d) Cuál es la probabilidad que exactamente cuatro llamadas ocurran dentro de un minuto?
2. El tiempo entre fallas de un láser de una máquina de citogenética es exponencialmente
distribuida con una media de 25 mil horas.
a) Cuál es el tiempo esperado hasta la segunda falla?
b) Cuál es la probabilidad que el tiempo hasta la tercera falla exceda las 50000 horas?
3. Errores causados por contaminación en discos ópticos ocurren a una tasa de un error cada
105 bits. Asuma que los errores siguen una distribución de Poisson.
a) Cuál es el número medio de bits hasta que cinco errores ocurren.
b) Cuál es la desviación estándar del número de bits hasta que cinco errores ocurren?
5.4 Modelo Weibull 117
c) El código corrección-errores podría ser inefectivo si existen tres o más errores en los
105 bits. Cuál es la probabilidad de este evento?
4. Dada la variable aleatoria X gamma con valor esperado 8 y varianza 32. Determinar la
probabilidad que X asuma un valor mayor que su moda pero menor que su media.
5. Un individuo empezó a pescar en la orilla de un lago, a las 9 de la mañana. Si el tiempo
que tarda en atrapar un pez se distribuye exponencialmente con media de 3 (en horas).
Determinar las siguientes probabilidades:
a) Atrape el cuarto pez antes de las 10 de la mañana.
b) Atrape el quinto pez entre las 9 : 40 a.m. y las 10 : 20 a.m.
c) Atrape su primer pez antes de las 10 de la mañana, dado que hasta las 9 : 40 a.m. no
había logrado atrapar ninguno.
6. En un cade para pago de servicios, el tiempo que tarda la cajera en atender a un individuo
se distribuye exponencial con parámetro β = 10 (horas). Si hay once personas delante de
usted, en la fila, y son las 9 : 39 a.m., determine la probabilidad de que pague su recibo antes
de las 10 : 15 a.m.
7. En un peaje los automóviles llegan a un ritmo promedio de 2.4 autos por minuto. Cada
automóvil paga $12, 000. Determine la probabilidad de que, a partir de un momento dado,
el encargado del cobro e peaje logre captar $192, 000 en menos de cinco minutos.
8. En una ciudad se observa que el consumo diario de energía (en millones de kilowatt-hora)
es una variable aleatoria que sigue una distribución gamma con parámetros α = 3 y β = 13 .
Si la planta de energía que suministra a la ciudad tiene una capacidad diaria de generar un
máximo de 12 millones de kilowatt-hora, ¿cuál es la probabilidad de que haya un día donde
no se pueda satisfacer la demanda?
9. Se sabe que el tiempo de sobrevivencia, en días, de armadillos expuestas a glifosato es una
variable aleatoria que sigue una distribución gamma con parámetros α = 4 y β = 0.10,
¿cuál es la probabilidad de que un armadillo no supere los sesenta días de vida después de
contaminarse con este tóxico?
10. Diana entra a un banco que tiene n cajeros. Todos los cajeros están ocupados dando servicio
a clientes, y existe una única fila que abastece de usuarios a los cajeros, con un cliente por
delante de Diana. Si el tiempo de servicio de un cliente es exponencial con parámetro λ ,
halle la distribución para el tiempo de espera para Diana en la fila.
Definición 5.3
La variable aleatoria X se distribuye Weibull si y solamente si su función de densidad de
probabilidad es
(
αβ xα−1 e−β x X ≥ 0
α
f (x) =
0 x<0
N
118 Modelos continuos
Proposición 5.5
Si X ∼ W (α, β ) entonces la función de distribución, acumulativa, es
5.3
Si X ∼ W (2; 2.5), representa el tiempo de vida en años de una parte de una maquina. Hallar la
probabilidad que la parte falle durante los primeros seis meses, y la probabilidad que la parte
dure por lo menos un año.
2
X P(X ≤ 0.5) = F(0.5) = 1 − e−2.5(0.5) ≈ 0.465
2
X P(X > 1) = 1 − F(1) = e−2.5(1 ) ≈ 0.082
Proposición 5.6
Si X ∼ W (α, β ) entonces
Γ(1 + α1 )
1 2 2 1
E(X) = 1 ; V (X) = 2 Γ(1 + ) − Γ (1 + )
βα βα α α
5.5 Modelo Beta 119
Definición 5.4
Sean a > 0 y b > 0. La función beta se define por
Z 1
B(a, b) := xa−1 (1 − x)b−1 dx
0
Proposición 5.7
Para a > 0 y b > 0
Γ(a)Γ(b)
B(a, b) =
Γ(a + b)
Definición 5.5
La variable aleatoria X se distribuye Beta con parámetros a, b, si y solo si su función de
densidad es
f (x) = B(a, b)
0 otro caso
Proposición 5.8
Si X ∼ B(a, b) entonces
a ab
E(X) = ; Var(X) =
a+b (a + b + 1)(a + b)2
Definición 5.6
La variable aleatoria X se distribuye normal, con media µ y varianza σ 2 , si y solamente si su
función de densidad de probabilidad es
2
1 − (x−µ)
f (x) = √ e 2σ 2
2πσ
El modelo normal también es conocido como modelo gaussiano.
120 Modelos continuos
Proposición 5.9
Si X ∼ N(µ, σ 2 ), entonces
1 2 2
a) MX (t) = eµt+ 2 σ t t
b) E(X) = µ
c) Var(X) = σ 2
En efecto
2
1
Z ∞
− (x−µ)
MX (t) = √ e 2σ 2 etx dx
−∞ 2πσ
2 2
1
Z ∞
− x −2µx+µ
=√ e 2σ 2 etx dx
2πσ −∞
2 2 2
1
Z ∞
− x −2µx+µ2 −2σ tx
=√ e 2σ dx
2πσ −∞
2 2 2 2 2
1
Z ∞
− [(x−µ)−σ t] +µ2 −(µ+σ t)
=√ e 2σ dx
2πσ −∞
2 2 2 t−σ 4 t 2
1
Z ∞
− [(x−µ)−σ t] −2µσ
=√ e 2σ 2 dx
2πσ −∞
2 t]2 2µσ 2 t+σ 4 t 2
1
Z ∞
− [(x−µ)−σ
= √ e 2σ 2 e 2σ 2 dx
2πσ −∞
2 t]2
1
Z ∞
σ 2t2 − [(x−µ)−σ
= eµt+ 2 √ e 2σ 2 dx
−∞ 2πσ
2
1
Z ∞
σ 2t2 − (x−µ)]
= eµt+ 2 √ e 2σ 2 dx
−∞ 2πσ
1 2t 2
= eµt+ 2 σ
5.6 Modelo normal 121
por tanto
E(X) = lı́m MX0 (t) = µ; E(X 2 ) = lı́m MX00 (t) = µ 2 +σ 2 ⇒ Var(X) = E(X 2 )−(E(X))2 = µ +σ 2 − µ 2 = σ 2
t→0 t→0
Definición 5.7
Sea X una variable aleatoria con media µ, finita, y varianza σ 2 . La estandarización de X es
X −µ
la variable aleatoria X ∗ := . Esta variable aleatoria cumple E(X ∗ ) = 0, Var(X ∗ ) = 1
σ
y X = σ X ∗ + µ; es decir X ∗ es exactamente X medida en diferentes unidades, llamadas
unidades estándar.
Definición 5.8
Dada X ∼ N(µ, σ 2 ), la estandarización de X se denota por Z y se le llama distribución
normal estándar. La función de densidad de probabilidad de Z está dada por
1 z2
f (z) = √ e− 2
2π
La función de distribución, acumulativa, de Z se simboliza por Φ, y está dada por
Z z
1 x2
Φ(z) = √ e− 2 dx
2π −∞
Usualmente, el manejo de la distribución normal estándar se hacia mediante tabla de sus valores.
122 Modelos continuos
Sin embargo, es posible emplear software estadístico para hallar sus valores. En general se tienen las
siguientes aproximaciones:
Proposición 5.10
Si Z ∼ N(0, 1) entonces
Z ∞
z2 √
e− 2 dz = 2π
−∞
Una función relacionada con la función de distribución Φ es la función error, denotada erf y definida
por
Z x
2 2
er f (x) := √ e−z dz, x ≥ 0
π 0
Definición 5.9
Sea X una variable aleatoria con FD, F, y consideremos un número real p tal que 0 < p < 1.
Un cuartil de orden p de la variable aleatoria X, o de su DF, F, es un número denotado por
x p que satisface:
5.4
Ejercicios 5.4
1. El angiograma es una prueba de diagnóstico estándar que se utiliza en medicina clínica
para detectar un accidente cerebrovascular en pacientes. Esta prueba tiene algunos riesgos
para el paciente y se han desarrollado varias técnicas no invasivas, que se espera sean tan
eficaces como el angiograma. Uno de estos métodos utiliza la medición de flujo sanguíneo
cerebral (FSC) en el cerebro, ya que los pacientes con accidente cerebrovascular tienden a
tener niveles más bajos de FSC de lo normal. Entre las personas sanas, el FSC se distribuye
normalmente con una media de 75 y desviación estándar 17. Los pacientes se clasifican
como en riesgo de accidente cerebrovascular si su FSC es inferior a 40. ¿Qué proporción de
pacientes normales se clasificará erróneamente como en riesgo de accidente cerebrovascular?
2. La población de estudio son hombres de 35 a 44 años cuyas presiones arteriales se distribu-
yen normalmente con una media 80 y desviación estándar 12. Un hipertenso límite se define
como una persona cuya presión arterial diastólica está entre 90 y 95 mm Hg inclusive.
a) ¿Qué proporción de sujetos tienen hipertensión límite?
b) Un hipertenso es una persona cuya presión arterial diastólica está por encima de 95
mm Hg; ¿Qué proporción de sujetos son hipertensos?
3. Si X ∼ N(0, 4), determine el valor de P(X − X4 ≥ 0)
4. Si X p∼ N(0, 1), determine la función de densidad de probabilidad de la variable aleatoria
Y = |X|
5. Si X ∼ N(0, 1), determine la función de densidad de probabilidad de la variable aleatoria
Y = X2
6. Si X ∼ N(0, 1), determine
a) E(sin(X))
124 Modelos continuos
b) E(X cos(X))
X
c) E( 1+X 2)
7. La cantidad de cereal en una caja es normal con media de 400 gramos. Si al responsable de
llenado de las cajas con cereal, es responsable de llenar al menos el 90 % de las cajas de
cereal con 380 gramos o más de cereal, ¿cuál es el valor más grande posible de la desviación
estándar para la cantidad de cereal en una caja?
8. Si X ∼ N(µ, σ 2 ), demuestre que P(|X − µ| > kσ ) no depende de µ ni de σ .
9. Halle el valor esperado y la varianza de la variable aleatoria X cuya función densidad de
probabilidad es
r
2 −2(x−1)2
f (x) = e
π
10. Determine el valor o valores de k de manera que la siguiente sea la función densidad de
probabilidad de una variable normal:
√ 2 2
f (x) = ke−k x −2kx−1 , −∞ < x < ∞
Bivariadas discretas
Bivariadas continuas
Distribuciones condicionales e indepen-
dencia
Independencia, covarianza y correlación
Existen muchas situaciones en las cuales es necesario analizar dos o más variables simultáneamente,
para establecer relaciones entre estas o como una o más afecta a una o más variables.
6.1
usualmente P({X = x} ∩ {Y = y}) se escribe simplemente P(X = x;Y = y), donde el punto y
coma, “;”, representa la intersección de los eventos {X = x} y {Y = y}. La función f (x, y) se
llama función masa de probabilidad conjunta de X y Y , y tiene las siguientes propiedades:
I ) Para todo x, y, 0 ≤ f (x, y) ≤ 1
II ) ∑x ∑y f (x, y) = 1
126 Modelos aleatorios bivariados
6.2
Y \X X =0 X =1
Y =0 0.50 0.05
Y =1 0.10 0.35
Y \X X =0 X =1 fY (y)
Y =0 0.50 0.05 0.55
Y =1 0.10 0.35 0.45
fX (x) 0.60 0.40
Definición 6.2
Sean X y Y variables aleatorias discretas con fmpc fX,Y . Las fmp de las variables aleatorias,
llamadas función masa de probabilidad marginal, se definen por
a) Marginal de X:
b) Marginal de Y :
6.3
De las 12 cartas mayores (jotas, reinas y reyes) de una baraja ordinaria de 52 cartas se sacan
tres cartas sin reemplazo. Sea X el número de reyes que se seleccionan y Y el número de jotas.
Calcule
a) La función masa de probabilidad conjunta de X y Y .
b) La probabilidad P((X,Y ) ∈ A), donde A es el evento A = {(x, y) : x + y ≥ 2}
a) Tanto X como Y tienen rango de valores: 0, 1, 2, 3, entonce la fmpc de X y Y está dada por
4 4
4
P(X = x;Y = y) = x y 3−x−y
x = 0, 1, 2, 3; y = 0, 1, 2, 3
12
f (x, y) = 3
0 otros casos
es decir,
4
220 x = 0, y = 0
24
x = 1, y = 0
220
24
x = 2, y = 0
220
4
x = 3, y = 0
220
24
x = 0, y = 1
220
f (x, y) = 24
x = 0, y = 2
220
4
x = 0, y = 3
220
64
x = 1, y = 1
220
24
220 x = 2, y = 1
24
x = 1, y = 2
220
b)
24 24 64 4 4 24 24 168
P(X +Y ≥ 2) = P(X +Y = 2)+P(X +Y = 3) = + + + + + + =
220 220 220 220 220 220 220 220
Definición 6.3
La función de distribución conjunta acumulativa de las variables aleatorias X y Y está definida
por
6.4
Dada la fmpc:
(
Cp(1 − p)x 0 ≤ x ≤ 9, 0 ≤ y ≤ 9
fX,Y (x, y) =
0 otro caso
Sea p = 18
a) Hallar el valor de la constante C para que f sea una fmpc
b) Hallar las funciones marginales de X y Y .
c) Determinar las distribuciones condicionales fX|Y y fY |X
b) Marginal de X:
9
0.1357 7 x 1.357 7 x
fX (x) = ∑ 8 8 =
y=0 8 8
luego
x
1.357 7
0≤x≤9
8 8
fX (x) =
0
otro caso
c) Marginal de Y :
9
0.1357 7 x 1.357 9 7 x
1
fY (y) = ∑ = ∑ =
x=0 8 8 8 x=0 8 10
luego
1 0≤y≤9
fY (x) = 10
0 otro caso
d) Condicional de X dado Y :
x
0.1357 7
8 1.357 7 x
fX,Y (X,Y ) 8
fX|Y (x|y) = = 1
= = fX (x)
fY (y) 10
8 8
e) Condicional de X dado Y :
x
7
0.1357
fX,Y (X,Y ) 88 1
fY |X (y|x) = = x = = fY (y)
fX (x) 1.357 7 10
8 8
6.1 Bivariadas discretas 129
6.5
SX,Y = {(−1, −1), (−1, 0), (−1, 1), (1, −1), (1, 0), (1, 1)}
1 pε
X P(X = −1,Y = 0) = P(Y = 0|X = −1) · P(X = −1) = (pε ) · 4 = 4
X P(X = −1,Y = 1) = P(Y = 1|X = −1) · P(X = −1) = (p) · 14 = 4p
X P(X = 1,Y = −1) = P(Y = −1|X = 1) · P(X = −1) = (p) · 43 = 3p 4
X P(X = 1,Y = 0) = P(Y = 0|X = 1) · P(X = 1) = (pε ) · 34 = 3p4 ε
ε)
X P(X = 1,Y = 1) = P(Y = 1|X = 1) · P(X = 1) = (1 − p − pε ) · 43 = 3(1−p−p
4
Resumimos esta fmpc de X y Y con la siguiente tabla, junto con las marginales de X y de Y .
X \Y −1 0 1 fX (x) = P(X = x)
1−p−pε pε p 1
−1 4 4 4 4
3p 3pε 3(1−p−pε ) 3
1 4 4 4 4
1−pε p 3(1−pε )
fY (y) = P(Y = y) 4 +2 pε 4 − 2p
b) P(Y = 0) = fY (0) = pε
6.6
En una reserva natural, que incluye turismo controlado, un turista llega a un punto que se
bifurca en tres caminos posibles. El primer camino retorna al turista a este mismo punto luego
de una hora de viaje; el segundo camino devuelve al turista al mismo punto luego de seis
horas de recorrido, y el tercer camino lleva al turista de regreso a la entrada de la reserva
natural, luego de dos horas de caminata. Infortunadamente, la reserva no cuenta con sistema
de señalización para orientar a los turistas. Suponga que el turista selecciona un camino con
130 Modelos aleatorios bivariados
igual probabilidad, todas las veces. Determinar el tiempo medio hasta que el turista llegue a la
entrada de la reserva.
Denotemos con T la variable aleatoria “tiempo que le toma al turista llegar a la entrada de la
reserva”, y con B j el evento “el turista escoge el camino j”, j = 1, 2, 3. El objetivo es calcular E(T ).
E(T ) = E(T |C1 )P(C1 ) + E(T |C2 )P(C2 ) + E(T |C3 )P(C3 )
1
= E(T |C1 ) + E(T |C2 )) + E(T |C3 ) ·
3
3E(T ) = (1 + E(T )) + (6 + E(T )) + 2
⇒ E(T ) = 9
6.7
Entonces
observemos que V es aleatoria pero N no. Hemos de condicionar a N de manera que N ≤ 100 porque
no es óptimo financieramente comprar más boletos que la demanda máxima. Calculemos E(V )
luego
100 100
1 100
E(G(N)) = 200 + 4 · ∑ N − k · − 1.8N
k=N+1 2 k
El valor de N se halla, generando los cien valores posibles de E(G(N)) para N = 0, 1, . . . , 100 y
seleccionando el valor de N que da el máximo de E(G(N)).
Definición 6.4
Sean X y Y variables aleatorias continuas. La función de densidad de probabilidad conjunta
de X y Y , es una función integrable f tal que
I ) Para todo (x, y) ∈ R2 , f (x, y) ≥ 0
R∞ R∞
II ) −∞ −∞ f (x, y)dA = 1
6.8
Determinar
a) la probabilidad que el componente 1 dure menos tiempo que el componente 2.
b) la probabilidad que ambos componentes duren más de tres horas.
a) la probabilidad que el componente 1 dure menos tiempo que el componente 2 está dada por
Z ∞Z y
P(X < Y ) = ye−y(1+x) dxdy
0 0
Z ∞ x=y
−y(x+1)
= −e dy
0
x=0
Z ∞
−y(y+1)
= (−e + e−y )dy
0
Z ∞ Z ∞
2 −y
=− e−y dy + e−y dy
0 0
≈ 0.4544
132 Modelos aleatorios bivariados
Definición 6.5
Sean X, Y variables aleatorias continuas con fdpc f (x, y). Las distribuciones marginales de X
y Y están dadas por
I ) Marginal de X:
Z ∞
fX (x) := f (x, y)dy
−∞
II ) Marginal de Y :
Z ∞
fY (y) := f (x, y)dx
−∞
6.9
La región donde está definida la función densidad de probabilidad conjunta es dada a conti-
nuación:
6.2 Bivariadas continuas 133
a) Marginal de X:
Z 2x
3
fX (x) = dy
2 4
(x
3 2
4 (2x − x ) si 0 ≤ x ≤ 2
=
0 otro caso
b) Marginal de Y :
Z √y
3
fY (y) = dx
y
2
4
( √
3 y
4 ( y − 2 ) si 0 ≤ y ≤ 4
=
0 otro caso
Definición 6.6
Sean X y Y variables aleatorias continuas, con fdpc fX,Y . La función de distribución conjunta
acumulativa de X y Y , denotada FX,Y está definida por
Z x Z y
FX,Y (x, y) := fX,Y (s,t)dtds
−∞ −∞
6.10
Hallar la fdpc de las variables aleatorias X y Y cuya función de distribución conjunta acumula-
tiva es
∂ 2F
f (x, y) = = β 2 e−β (x+y) , x > 0, y > 0
∂ x∂ y
134 Modelos aleatorios bivariados
Definición 6.7
Sean X y Y variables aleatorias con función densidad de probabilidad conjunta fX,Y .
I ) La función densidad de probabilidad condicional de X dado el evento Y = y se define
por
fX,Y (x, y)
fX|Y =y (x|y) := , fY (y) > 0
fY (y)
fX,Y (x, y)
fY |X=x (y|x) := , fX (x) > 0
fX (x)
X Dadas fX|Y (x|y) y fY (y) entonces fX,Y (x, y) = fX|Y (x|y) y fY (y) · fY (y).
X Dadas fY |X (y|x) y fX (x) entonces fX,Y (x, y) = fY |X (y|x) y fX (x) · fX (x).
6.11
Si
2y + 4x 1 + 4x
fY |X (y|x) = ; fX (x) = para 0 < x < 1, 0 < y < 1
1 + 4x 3
Determinar:
a) P(X +Y ≤ 1)
b) E(Y )
c) E(X|Y = 12 )
2y + 4x si 0 < x < 1, 0 < y < 1
fX,Y (x, y) = 3
0 otro caso
6.3 Distribuciones condicionales e independencia 135
a)
Z 1Z x
2y + 4x
P(X +Y ≤ 1) = dydx
0 0 3
1
x
1
Z
2
= y + 4xy dx
3 0 0
1 1 2
Z
= (x + 4x2 )dx
3 0
1 5 3 1
= x
3 3 0
5
=
9
b) Hallemos primero la fdp marginal de Y :
Z 1
2y + 4x
fY (y) = dx
0 3
1
1 2
= (2yx + 2x )
3 0
2y + 2 si 0 < y < 1
= 3
0 otro caso
Entonces
1
1 2y3
Z 1
2y + 2 2
1 2 5
E(Y ) = y· dy = +y = · +1 =
0 3 3 3 0 3 3 9
Z 1
1 1
E(X|Y = ) = x · fX|Y (x| )dx
2 0 2
Z 1
1 + 4x
= x· dx
0 3
1 1
Z
= (x + 4x2 )dx
3 0
1 x2 4x3 1
= +
3 2 3
0
1 1 4
= +
3 2 3
11
=
18
136 Modelos aleatorios bivariados
Definición 6.8
Supongamos que Y = y, condicionando sobre este evento la nueva distribución de X tiene fmp
o fdp condicional fX|Y (x|y) que es función de x, y el valor esperado de esta variable aleatoria
X|y está definido por
Z ∞
E(X|y) := x fX|Y (x|y)dx, o bien E(X|y) := ∑ x fX|Y (x|y)
−∞ x
Definición 6.9
Dado el evento Y = y la esperanza condicional E(X|y) es una función de y, digamos g(y) :=
E(X|y). Entonces g(Y ) es una variable aleatoria, con fdp fY , llamada esperanza condicional
y denotada E(X|Y )
6.12
Sea X el primer punto seleccionado, entonces X ∼ U[0, 1], si Y es el segundo punto seleccionado
entonces Y |X = x ∼ U[x, 1].
a) Intuitivamente E(Y |X = x) = x+1
2 . Vamos a demostrarlo.
b) Distribución condicional de Y dado X:
(
1
1−x si x < y < 1
fY |X (y|x) =
0 otros casos
c) Esperanza condicional:
2 1
1 − x2 1 + x
Z 1
1 1 y 1
E(Y |X = x) = y dy = = · =
x 1−x 1−x 2 x 1−x 2 2
por tanto
1+X
E(Y |X) =
2
En el análisis multivariado, una de las tareas importantes es establecer a partir del modelo conjunto
algunos estadísticos como la media y la varianza de una de las variables, es decir la media y la
varianza incondicional de una de las variables a partir de la media o varianza condicional respecto
de otra u otras variables.
6.3 Distribuciones condicionales e independencia 137
Proposición 6.1
La esperanza condicional E(X|Y ) satisface
E(E(X|Y )) = E(X)
En efecto
X Caso discreto
= ∑ x fX (x)
x
= E(X)
X Caso continuo
Z ∞
E(E(X|Y )) = E(X|y) fY (y)dy
−∞
Z ∞ Z ∞
= x fX|Y (x|y)dx fY (y)dy
−∞ −∞
Z ∞ Z ∞
= x fX|Y (x|y) fY (y)dy dx
−∞ −∞
Z ∞ Z ∞
= x fX,Y (x, y)dy dx
−∞ −∞
Z ∞
= x fX (x)dx
−∞
= E(X)
6.13
El 60 % de una población mayor son mujeres y el resto, 40 %, son hombres. Suponga que
el peso promedio de las mujeres es 70 kilogramos, mientras que el peso promedio de los
hombres es de 85 kilogramos. ¿Cuál es el peso promedio de esta población mayor?
138 Modelos aleatorios bivariados
Definición 6.10
Sean X y Y variables aleatorias. Se define la varianza de X dado el evento Y = y, conocida
como la varianza condicional de X dado Y = y, de la siguiente manera:
N
X La varianza condicional Var(X|y) se calcula como una función de X, y para su cálculo
se utiliza la distribución condicional fX|y .
X Para cada valor y, Var(X|y) es una función de y entonces Var(X|Y ) es una variable
aleatoria con fdp fY
6.14
X\Y −1 1
1 0.2 0.4
2 0.3 0.1
a) Distribuciones marginales: fX (1) = 0.6, fX (2) = 0.4; fY (−1) = 0.5, fY (1) = 0.5.
b) Distribución condicional de X dado Y = y:
(
0.4 x = 1
fX|Y (x| − 1) =
0.6 x = 2
(
0.8 x = 1
fX|Y (x|1) =
0.2 x = 2
(
3
4 y = −1
fY |X (y|2) = 1
4 y=1
E(E(X|Y )) = E(X| − 1) · fY (−1) + E(X|1) · fY (1) = (1.6) · (0.5) + (1.2) · (0.5) = 1.4
Observemos que
Proposición 6.2
Sean X y Y variables aleatorias, con primeros y segundos momentos condicionales finitos,
entonces
en efecto
2
2 2 2
E(Var(X|Y )) + Var(E(X|Y )) = E E(X |Y ) − (E(X|Y )) + E (E(X|Y )) − E(E(X|Y )
| {z }
E(X)
= E(E(X 2 |Y )) − 2
E[(E(X|Y
)) ] + 2
E[(E(X|Y
)) ] − (E(X))2
| {z }
E(X 2 )
= E(X 2 ) − (E(X))2
= Var(X)
Ilustramos este resultado con los datos del ejemplo anterior:
X
Var(X) = E(X 2 ) − (E(X))2
2
= 12 · (0.6) + 22 · (0.4) − 1 · (0.6) + 2 · (0.4)
= 2.2 − (1.4)2
= 0.24
140 Modelos aleatorios bivariados
X
E(Var(X|Y )) = (0.24) · (0.5) + (0.16) · (0.5) = 0.20
2
2 2
Var(E(X|Y )) = (1.6) · (0.5) + (1.2) · (0.5) − (1.6) · (0.5) + (1.2) · (0.5) = 0.04
Entonces
6.15
6.16
a) Distribución marginal de X:
Z 1−x
fX (x) = 24x(1 − x − y)dy
0
Z 1−x
= 24x (1 − x − y)dy
0
y2 y=1−x
= 24x (1 − x)y −
2 y=0
(1 − x)2
2
= 24x (1 − x) −
2
(
12x(1 − x)2 0 ≤ x ≤ 1
fX (x) =
0 otro caso
142 Modelos aleatorios bivariados
b) Distribución marginal de Y :
Z 1−y
fY (y) = 24x(1 − x − y)dx
0
Z 1−y
= 24 (x(1 − y) − x2 )dx
0
x2 x3 x=1−y
= 24 (1 − y) −
2 3 x=0
(1 − y)3 (1 − y)3
= 24 −
2 3
= 4(1 − y)3
(
4(1 − y)3 0≤y≤1
fY (y) =
0 otro caso
Claramente fX (x) · fY (y) 6= fX,Y (x, y), por tanto X y Y son variables dependientes.
N
X Si X y Y son variables aleatorias independientes entonces
fX|Y (x|y) = fX (x), ∀y, fY (y) 6= 0
X La varianza de la variable aleatoria X, denotada Var(X) o bien σX2 , es una medida de
dispersión de los datos de X respecto de su media µX .
Teorema 6.1
Sean X y Y son variables aleatorias independientes con fdp fX y fY , respectivamente. g(X) y
h(Y ), funciones de X y Y , entonces
E g(X)h(Y ) = E(g(X))E(h(Y ))
Como Xy Y son independientes entonces la fdp conjunta de X y Y es fX,Y (x, y) = fX (x) fY (y),
entonces
Z∞Z∞
E g(X)h(Y ) = g(x)h(y) fX,Y (x, y)dydx
−∞ −∞
Z ∞Z ∞
= g(x)h(y) fX (x) fY (y)dydx
−∞ −∞
Z ∞ Z ∞
= g(x) fX (x) h(y) fY (y)dy dx
−∞ −∞
Z ∞
= g(x) fX (x)dx
−∞
Z ∞
= E(h(Y )) g(x) fX (x)dx
−∞
= E(h(Y ))E(g(X))
= E(g(X))E(h(Y ))
6.4 Independencia, covarianza y correlación 143
6.17
Sean X ∼ U(0, π), Y ∼ U(−1, 1), g(x) = sin(x), h(y) = e−|y| , entonces
ahora bien
1 2
Z π
E(sin X) = sin(x)dx =
0 π π
Z 1 Z 1
1 −|y|
E(e−|Y | ) = e dy = e−y dy = 1 − e−1
−1 2 0
luego
2
E(sin(X)e−|Y | ) = · (1 − e−1 )
π
Una medida de dispersión conjunta de dos variables aleatorias, respecto de sus valores medios, es la
covarianza que se define a continuación.
Definición 6.12
Sean X y Y variables aleatorias conjuntamente distribuidas. La varianza conjunta de X y Y ,
denominada covarianza de X y Y se denota por Cov(X,Y ) o simplemente C(X,Y ), y está
definida por
Proposición 6.3
En efecto
6.18
Hallar la covarianza de X y Y
a)
Z 1 Z 1−|x|
1
E(X) = x · dydx
−1 −1+|x| 2
Z 1 1−|x|
1
= x y
2 −1 −1+|x|
Z 1
1
= x · (2 − 2|x|)dx
2 −1
Z 1
= x(1 − |x|)dx integral de una función impar en intervalo simétrico al origen
−1
=0
b)
Z 1 Z 1−|y|
1
E(Y ) = y · dxdy
−1 −1+|y| 2
=0 como en el caso de X
6.4 Independencia, covarianza y correlación 145
c)
Z 1 Z 1−|x|
1
E(XY ) = xy · dydx
−1 −1+|x| 2
Z 1 2 1−|x|
1 y
= x
2 −1 2 −1+|x|
1 1
Z
= x[(1 − |x|)2 − (−1 + |x|)2 ]dx
4 −1
1 1
Z
= x · 0dx
4 −1
=0
Teorema 6.2
Sean X, Y y Z variables aleatorias distribuidas conjuntamente, , y b constantes reales fijas.
Entonces
I ) Cov(X, X) = Var(X) no negatividad.
II ) Cov(X,Y ) = Cov(Y, X) simetría.
III ) Cov(aX,Y ) = aCov(X,Y ) homogeneidad en la primera componente (y también en la
segunda, por simetría).
IV ) Cov(aX + bY, Z) = aCov(X, Z) + bCov(Y, Z) linealidad en la primera componente, y
en la segunda por simetría; es decir bilinealidad.
V ) Cov(X, a) = 0
En efecto
I) Cov(X, X) = E(XX) − E(X)E(X) = E(X 2 ) − µX2 = Var(X)
II ) Cov(X,Y ) = E(XY ) − E(X)E(Y ) = E(Y X) − E(Y )E(X) = Cov(Y, X)
III )
= aCov(X,Y )
146 Modelos aleatorios bivariados
IV )
= aCov(X, Z) + bCov(Y, Z)
Definición 6.13
Sean X y Y variables aleatorias tales que Cov(X,Y ) = 0, entonces X y Y se llaman variables
no correlacionadas.
Teorema 6.3
Si X y Y son variables aleatorias independientes entonces X y Y son no correlacionadas.
Definición 6.14
Sean X y Y variables aleatorias con primeros y segundos momentos finitos. Definimos el
coeficiente de correlación entre X y Y por
Cov(X,Y )
ρX,Y :=
σX σY
siendo σX y σY las desviaciones estándar de X y Y , respectivamente.
6.19
Proposición 6.4
Sea X una variable aleatoria tal que E(X) = µ < +∞, entonces Var(X) = 0 si y solo si
P(X = µ) = 1
Teorema 6.4
Sean X y Y variables aleatorias con primeros y segundos momentos finitos. Entonces
|ρX,Y | ≤ 1
148 Modelos aleatorios bivariados
En efecto
X − µX Y − µY 2
E ± ≥0
σX σY
X − µX 2 Y − µY 2
(X µX )(Y − µY )
E + ± 2E ) ≥0
σX σY σX − σY
E (X − µX )(Y − µY )
E[(X − µX )2 ] E[(Y − µy )2 ]
+ ± 2 ≥0
σX2 σY2 σX σY
σX2 σY2
+ ± 2ρXY ≥ 0
σX2 σY2
2 ± 2ρXY ≥ 0
−1 ≤ ρXY ≤ 1
N
X De la prueba anterior se sigue:
X − µX Y − µY
ρXY = ±1 ⇐⇒ =± con probabilidad 1
σX σY
es decir,
X − µX Y − µY
I) Si ρX,Y = 1, entonces = , por tanto, despejando Y , tenemos:
σX σY
σY σY
Y − µY = X+ − µX
σX σX
X − µX Y − µY
II ) Si ρX,Y = −1, entonces =− , por tanto, despejando Y , tenemos:
σX σY
σY σY
Y − µY = − X+ µX
σX σX
X En general ρXY es una medida que tanto Y − µY se puede aproximar o estimar por una
función lineal de X − µX
Ejercicios
1. Un dado legal se lanzan dos veces. Sean X la variable aleatoria “el máximo de las dos caras”
y Y “la suma de las dos caras”, en los dos lanzamientos.
a) Hallar la función masa de probabilidad conjunta de X y Y .
b) Hallar E(X|Y = 7)
c) Hallar Var(X|Y = 7)
d) Hallar E(Y |X = 5)
e) Hallar Var(Y |X = 5)
f ) Hallar Cov(X,Y )
6.4 Independencia, covarianza y correlación 149
2. Sean X ∼ U(−1, 1) y Y ∼ U(0, 1). Hallar la probabilidad que la ecuación cuadrática tenga
raíces reales.
t 2 + 2Xt +Y = 0
√
3. Sean X ∼ U(0, 1) y Y |X = x ∼ U(0, x). Hallar la función de densidad de probabilidad
marginal de la variable aleatoria Y .
4. La función de distribución acumulativa de X y Y es
(
(1 − e−x )(1 − e−y ) x > 0, y > 0
FX,Y (x, y) =
0 otras partes
Hallar
a) P(1 < X < 3, 1 < Y < 4)
b) fX,Y (ln 2, − ln 4)
c) Sin hacer cálculos, son las variables aleatorias independientes?. Explique.
d) Sin hacer cálculos, hallar la función de densidad de probabilidad de X y determinar que
tipo de modelo es.
5. Si las variables aleatorias X y Y tienen función de densidad de probabilidad
(
24xy 0 < x + y < 1, x > 0, y > 0
fX,Y (x, y) =
0 otras partes
Determinar
a) P(Y ≤ X)
b) P(X < 21 ;Y < 21 )
c) P(X < 12 |Y = 41 )
d) P(X < 12 |Y < 41 )
6. Si las variables aleatorias X y Y tienen función de densidad de probabilidad
(
6x
1 ≤ x + y ≤ 2, x ≥ 0, y ≥ 0
fX,Y (x, y) = 7
0 otras partes
Determinar
a) P(Y ≥ X 2 )
b) P(max{X,Y } > 1).
7. Si las variables aleatorias X y Y tienen función de densidad de probabilidad conjunta
( √
4x 0 < x < y < 1
fX,Y (x, y) =
0 otras partes
Determinar la función de densidad de probabilidad marginal de Y .
8. Si las variables aleatorias X y Y tienen función de densidad de probabilidad
( 2
5xy
0<x<y<2
fX,Y (x, y) = 16
0 otras partes
Determinar
150 Modelos aleatorios bivariados
a) fX (x)
b) fY |x (y|x).
c) E[Y |X = x]
d) E[Y |X]
9. Suponga que X es uniformemente distribuida sobre {1, 2, 3}, y dado que X = j, Y es unifor-
memente distribuida sobre el intervalo [0, j]-
a) Hallar la función de probabilidad conjunta de X y Y .
b) Hallar la función de densidad de probabilidad de Y .
c) Hallar la función de densidad de probabilidad condicional de X dado que Y = y, para
y ∈ [0, 3]
10. Suponga que N ∼ Poiss(λ = 2) y que dado que N = n, Y se distribuye binomial con parámetro
n y p = 34 .
a) Hallar la función de probabilidad conjunta de N y Y .
b) Hallar la función de densidad de probabilidad de Y .
c) Hallar la función de densidad de probabilidad condicional de N dado que Y = k, para k
un número entero entre 0 y n
11. Hallar la fdp condicional de cada variable aleatoria dado un valor de la otra, y determine si las
variables son independientes, en cada uno de los siguientes casos:
a) (X,Y ) es uniformemente distribuida en Ω = {(x, y) : −6 ≤ x ≤ 6, −6 ≤ y ≤ 6}
b) (X,Y ) es uniformemente distribuida en Ω = {(x, y) : −6 ≤ y ≤ x ≤ 6}
c) (X,Y ) es uniformemente distribuida en Ω = {(x, y) : x2 + y2 ≤ 36}
d) (X,Y ) es uniformemente distribuida en Ω = {(x, y) : |x| + |y| ≤ 6}
12. Se selecciona aleatoriamente un punto (X,Y ) de una distribución uniforme sobre el disco
unitario de centro en (1, 1). Para un valor x dado, de la variable aleatoria X, en el intervalo
abierto (0, 2) y para un valor apropiado de y, en su dominio, determinar la función de densidad
de probabilidad condicional fY |x
13. Sean X y Y variables aleatorias independientes e idénticamente distribuidas con modelo
común uniforme en el intervalo [0, 1]. Hallar la probabilidad del evento {Y ≥ 12 } dado que
Y ≥ 1 − 2X.
14. Sean X y Y variables aleatorias independientes e idénticamente distribuidas, ambas exponen-
ciales con media igual a 1. Determinar la función de densidad de probabilidad de la variable
aleatoria W definida por W = max{X,Y }
15. Suponga que (X,Y, Z) se distribuye uniformemente en la región:
Ω = {(x, y, z) ∈ R3 : 0 ≤ x ≤ y ≤ z ≤ 1}
1 2 2
f (x, y) = √ e−x −xy−y si (x, y) ∈ R2
2π
a) Hallar la fdp condicional de X dado que Y = y.
b) Hallar la fdp condicional de Y dado que X = x.
c) ¿Son X y Y variables aleatorias independientes? Explique
18. Sean X y Y variables aleatorias independientes e idénticamente distribuidas, ambas con misma
función de densidad de probabilidad
( 2
3x
3 para 0 ≤ x ≤ b
f (x) = b
0 otro caso
Determinar
a) fX (x)
b) fY |x (y|x).
c) E[Y |X = x]
d) P(X ≤ 32 ;Y ≤ 21 )
e) P(Y ≤ 21 |X ≤ 23 )
22. Sean X ∼ gamm(α, λ ), Y∼ gamm(β , λ ), variables aleatorias independientes. Hallar:
X
a) la distribución conjunta de U = X +Y y V = X+Y .
b) P(U ≤ 1)
c) E(U|V ≤ 12 )
152 Modelos aleatorios bivariados
d) P(V ≥ 2)
23. Sean X y Y variables aleatorias normal estándar, independientes. Hallar:
a) la distribución conjunta de U = X y V = X +Y .
b) Var(V )
c) ρU,V
d) ¿Son U y V variables aleatorias independientes?, explique.
24. Sean X y Y variables aleatorias normal estándar, independientes. Hallar:
a) la distribución conjunta de U = YX y V = |Y |
b) la función densidad de probabilidad de U
c) E(U)
d) ¿Son U y V variables aleatorias independientes?, explique.
25. Si las variables aleatorias X y Y tienen función de densidad de probabilidad conjunta
emin{x,y} − 1 e−x−y 0 < x < ∞; 0 < y < ∞
fX,Y (x, y) =
0 otras partes
{(−2, 0), (−1, 0), (1, 0), (2, 0), (0, −2), (0, −1), (0, 1), (0, 2)}
a) Hallar Cov(X,Y )
b) Son X y Y variables aleatorias independientes?
28. Suponga que las variables X y Y son independientes e idénticamente distribuidas. Sea Z =
aX +Y . Si el coeficiente de correlación entre las variables X y Z es 13 , determinar el valor de
la constante a.
29. Sean X y Y variables aleatorias independientes e idénticamente distribuidas, con modelo
común chi-cuadrado con 2 grados de libertad.
a) Determinar la función generadora de momentos de la variable aleatoria 2X + 3Y .
b) Determine, si es posible, la función densidad de probabilidad o la función de distribución
de la variable aleatoria 2X + 3Y . Si no es posible argumente por qué.
30. Sean X y Y variables aleatorias independientes. Si X ∼ Bin(n, p) y Y ∼ Bin(m, p), determinar
la distribución de la variable aleatoria X +Y
31. Sean X y Y variables aleatorias independientes e idénticamente distribuidas, con modelo
común normal estándar. Determinar la distribución de la variable aleatoria 12 (X 2 +Y 2 )
32. Sean X y Y variables aleatorias tales que
1
E[X] = 1; E[Y ] = 2; E[X 2 ] = 2; E[Y 2 ] = 6;Cov(X,Y ) =
2
Hallar los valores de las constantes a y b de manera que la variable aleatoria aX + bY tenga
media 3 y varianza mínima.
6.4 Independencia, covarianza y correlación 153
33. Una urna contiene 5 bolas blancas y 3 bolas negras. Se toman al azar 2 bolas, sin reemplazo,
de la urna. Si X representa el número de bolas blancas extraídas” y Y “el número de bolas
negras extraídas”, determinar la covarianza de X y Y .
34. Si X representa el número de 1 y Y representa el número de 5 en tres lanzamientos de un dado
legal, determine el coeficiente de correlación de X y Y .
35. Sean X y Y variables aleatorias tales que Var(X) = 4, Var(Y ) = 16 y Cov(X,Y ) = 2, determi-
nar el valor de Var(3Y − 2X)
36. Sean X y Y variables aleatorias tales que
1
ρXY = ; σX2 = a; σY2 = 4a; σZ2 = 114
3
donde Z = 3X − 4Y . Determinar el valor de la constante a.
37. Sea X una variable aleatoria con varianza finita. Si Y = 15 − X, determinar el coeficiente de
correlación entre las variables aleatorias X y (X +Y )X
38. Si la fdp conjunta de X y Y es
(
K −1 < x < 1, x2 < y < 1
fX,Y (x, y) =
0 otro caso
Hallar E[Y |X = x]
48. Sean X y Y variables aleatorias con fdp conjunta
(
e−x 0 < x < ∞, 0 < y < 1
fX,Y (x, y) =
0 otro caso
3(2 − 2x − y)
61. Si fX,Y (x, y) = en la región en el plano acotada por los ejes coordenados y la
2
línea recta y = 2 − 2x, hallar la función de densidad marginal de X
62. Dada la fdp conjunta de X y Y
(
x2 + xy
3 0 < x < 1, 0 < y < 2
fX,Y (x, y) =
0 otro caso
Hallar E(X|Y = 21 )
64. Dada la fdp conjunta de X y Y
(
π
sin( πy −x
2 )e 0 < x < ∞, 0 < y < 1
fX,Y (x, y) = 2
0 otro caso
a) Hallar la covarianza de X y Y
b) ¿Son X y Y variables aleatorias independientes? Explique
70. Si X y Y están normalmente distribuidas con fdp conjunta
1 2
e− 6 [(2x−y) +2xy]
fX,Y (x, y) = √
2π 3
Hallar el coeficiente de correlación entre X y Y
71. Dada la fdp conjunta de X y Y
(
1
0 ≤ x2 + y2 ≤ 1
fX,Y (x, y) = π
0 otro caso
Cov(A, B) := Cov(IA , IB )
donde
(
1 si ω ∈ A
IA (ω) =
0 si ω ∈
/A
Demostrar que
a) Cov(A, B) = P(A ∩ B) − P(A)P(B)
b) Cov(A, Bc ) = −Cov(A, B)
c) Cov(Ac , Bc ) = Cov(A, B)
P(A ∩ B) − P(A)P(B)
d) ρA,B = p
P(A)(1 − P(A))P(B)(1 − P(B))
81. Suponga que (Ω, F , P) es un espacio de probabilidad y que A, B ∈ F . Demostrar que
a) Cov(A,s B) = P(A)(1 − P(B))
P(A)(1 − P(B))
b) ρA,B =
P(B)(1 − P(A))
82. Sean X y Y variables aleatorias independientes e idénticamente distribuidas con modelo
común:
1
√ para 0 < t ≤ 1
f (t) = 2 t
0 otro caso
lı́m E[Y |X = t]
t→∞
Sean U := YX y V := XY .
a) Hallar la fdp conjunta de U y V .
b) Hallar las fdp marginales de U y V .
c) Son U y V independientes?
87. Dado que X = x, Y es condicionalmente uniforme en el intervalo [x − π, x + π]. Utilice la ley
de probabilidades totales para calcular
E[cos(X +Y )]
P[Y > y]
E[XeY ]
7.1
En esta sección hallaremos la función de probabilidad de una variable aleatoria que ha sido construida
o definida a partir de otra variable aleatoria.
7.2
Sea X una variable aleatoria con fdp fX , y consideremos la variable aleatoria Y = 2x − 3 que
es una transformación afín de los valores de la variable aleatoria X. Estableceremos la función
de distribución de Y y la fdp de Y
a) Función de distribución de Y :
FY (y) = P(Y ≤ y)
= P(2X − 3 ≤ y)
y+3
= P(X ≤ )
2
y+3
= FX ( )
2
7.1 Transformación de una variable aleatoria 163
dFY
fY (y) = (y)
dy
d y+3
= FX ( )
dy 2
y+3 1
= fX ·
2 2
7.3
Sea X una variable aleatoria con fdp fX , y consideremos la variable aleatoria Y = −2x + 1
que es una transformación afín de los valores de la variable aleatoria X. Estableceremos la
función de distribución de Y y la fdp de Y
a) Función de distribución de Y :
FY (y) = P(Y ≤ y)
= P(−2X + 1 ≤ y)
= P(−2X ≤ y − 1)
y+1
= P(X ≥ )
−2
y+1
= 1 − P(X ≤ − )
2
y+1
= 1 − FX (− )
2
dFY
fY (y) = (y)
dy
d y+1
= 1 − FX (− )
dy 2
y+1 1
= − fX (− ) · (− )
2 2
y+1 1
= fX (− )·
2 2
164 Transformación de variables aleatorias
Proposición 7.1
Sea X una variable aleatoria con fdp fX , Y = aX + b una nueva variable aleatoria, entonces
dFY
fY (y) = (y)
dy
(
1 y−b
a fX ( a ) si a > 0
=
− 1a fX ( y−b
a ) si a < 0
1 y−b
= fX
|a| a
7.4
Sea X una variable aleatoria con fdp f , Y = e2X una nueva variable aleatoria. Determinar la
función de distribución y la función densidad de probabilidad de Y .
fY (y) = P(Y ≤ y)
= P(e2X ≤ y)
= P(ln(e2X ) ≤ ln(y)) siempre que tenga sentido ln(y)
= P(2X ≤ ln(y))
ln y
= P(X ≤ )
2
ln y
= FX
2
dFY
fY (y) = (y)
dy
dFX ( ln2y )
=
dy
ln y 1
= fX ·
2 2y
7.5
1
Sea X una variable aleatoria con fdp f , Y = √ una nueva variable aleatoria. Determinar la
X
función de distribución y la función densidad de probabilidad de Y .
7.1 Transformación de una variable aleatoria 165
fY (y) = P(Y ≤ y)
1
= P( √ ≤ y)
X
√ 1
= P( X ≥ ) para y 6= 0
y
1
= P(X ≥ 2 ) porque X > 0
y
1
= 1 − P(X ≤ 2 )
y
1
= 1 − FX 2
y
dFY
fY (y) = (y)
dy
dFX ( y12 )
=−
dy
1 2
= − fX 2 · − 3
y y
2 1
= 3 · fX 2
y y
Proposición 7.2
Sea X una variable aleatoria de tipo continuo y g : R −→ R una función diferenciable,
estrictamente monótona. La nueva variable aleatoria Y = g(X) tiene función densidad de
probabilidad:
−1
f (g−1 (y)) · dg (y) si
X dy
fY (y) =
0 otro caso
En efecto
I ) Caso 1: g es monótona creciente.
FY (y) = P(Y ≤ y)
= P(g(X) ≤ y)
= P(X ≤ g−1 (y)) porque g es monótona creciente
−1
= FX (g (y))
166 Transformación de variables aleatorias
Por tanto
FY (y) = P(Y ≤ y)
= P(g(X) ≤ y)
= P(X ≥ g−1 (y)) porque g es monótona decreciente
−1
= 1 − P(X ≤ g (y))
= 1 − FX (g−1 (y))
Por tanto
En resumen
−1
f (g−1 (y)) · dg (y) si
X dy
fY (y) =
0 otro caso
7.6
Sea X ∼ U([0, π]) y Y = sin(X). Hallar las funciones de distribución y densidad de probabili-
dad de Y
La función seno no es completamente creciente o decreciente en [0, π]. La inversa principal de seno
está definida en el intervalo [− π2 , π2 ] y se denota arc sen.
Respecto de la variable aleatoria Y su soporte es el intervalo [0, 1], entonces dado y ∈ [0, 1) existen
dos puntos x1 ∈ [0, π2 ] y x2 ∈ [ π2 , π] tales que y = sin(x1 ) = sin(x2 ), como observamos en la siguiente
ilustración
7.1 Transformación de una variable aleatoria 167
Ahora bien, es claro que x1 = arc sen(y), mientras que x2 = π − arcsin(y). Calculemos ahora la
función de distribución de probabilidad de Y :
FY (y) = P(Y ≤ y)
= P(0 ≤ Y ≤ y)
= P (0 ≤ X ≤ arcsin(y)) ∪ (π − arcsin(y) ≤ X ≤ π)
arcsin(y) + (π − (π − arcsin(y)))
= · I[0,1) (y) + I[1,∞) (y)
π
2 arcsin(y)
= I[0,1) (y) + I[1,∞) (y)
π
por tanto la función densidad de probabilidad de Y es:
2
p si 0 ≤ y < 1
π 1 − y2
fY (y) =
δ (1) si y ≥ 1
0 otro caso
Teorema 7.1
Sea X una variable aleatoria continua con soporte RX , y sea Y = g(X). Si existe una partición
de RX , RX = R1 ∪ R2 ∪ . . . ∪ Rm , tal que g es estrictamente monótona y diferenciable en cada
168 Transformación de variables aleatorias
7.7
Sea X una variable aleatoria con fmp o fdp f , y sea Y = g(X) una nueva variable aleatoria.
7.8
La fdp de X es
(
1
2π si x ∈ [−π, π]
fX (x) =
0 otro caso
I) Método directo:
Como Y ∈ [−1, 1] y la función cos(x) es creciente en [−π, 0] y decreciente en [0, π] entonces
abrimos el problema en dos partes:
dx −1
• y ∈ [−π, 0], entonces y = cos x implica x = π − cos−1 y, luego = −p =
dy 1 − y2
1
p .
1 − y2
dx 1
• y ∈ [0, π], entonces y = cos x implica x = cos−1 y, luego = −p .
dy 1 − y2
En consecuencia:
−1
dx
fY (y) = ∑ fX (cos (y))
cos x=y dy
por tanto
1 2
·p si cos−1 y ∈ [0, π]
2π
1 − y2
fY (y) =
0 otro caso
7.1 Transformación de una variable aleatoria 169
En resumen
1 1
·p si y ∈ [−1, 1]
π 1 − y2
fY (y) =
0 otro caso
Los eventos equivalentes al evento {Y ≤ y} son {X < − cos−1 y} y {X > cos−1 y}; luego la
FD de Y está dada por
FY (y) = P(Y ≤ y) = P(cos X ≤ y)
es decir
0
si y < −1
FY (y) = P(X ≤ − cos−1 y) + P(X ≥ cos−1 y) si − 1 ≤ y ≤ 1
1 si y > 1
0
si y < −1
cos−1 y
FY (y) = 1− π si − 1 ≤ y ≤ 1
1 si y > 1
7.9
y+1
P(0 < X ≤ y) 2
P(Y ≤ y) = P(X ≤ y|X > 0) = = 1
= y+1
P(X > 0) 2
En resumen:
(
0 si y ≤ 0
FY (y) =
y+1 si 0 < y ≤ 1
(
1 si 0 < y ≤ 1
fY (y) =
0 otro caso
Función distribución
7.10
Como X ∼ exp(α) y Y ∼ exp(α) entonces fX (x) = αe−αx , para x ≥ 0, y fY (y) = αe−αy para y ≥ 0,
respectivamente; por tanto la función densidad de probabilidad conjunta de X y Y , por independencia,
es
(
α 2 e−α(x+y) si x ≥ 0, y ≥ 0
fX,Y (x, y) =
0 otro caso
7.2 Transformación de dos variables aleatorias 171
sea z ≥ 0, entonces
P(Z ≤ z) = P(X +Y ≤ z)
Z z Z z−x
= α 2 e−α(x+y) dydx
0 0
Z z Z z−x
= αe−αx αe−αy dy dx
0 0
Z z z−x
−αx −αy
= αe −e dx
0 0
Z z
−αx −α(z−x)
= αe 1−e dx
0
Z z
−αx −αz
= αe − αe dx
0
Z z Z z
−αx −αz
= dx − αe
αe dx
0 0
z
= −e−αx − zαe−αz
0
= 1 − e−αz − zαe−αz
(
1 − e−αz − zαe−αz si z ≥ 0
P(Z ≤ z) =
0 si z < 0