Está en la página 1de 10

TEORÍA BÁSICA DE LA PROBABILIDAD

Primera parte

CONCEPTOS BÁSICOS

1.1 ESPACIOS DE PROBABILIDAD

1.1.1 EXPERIMENTOS Y EVENTOS. Formalmente, se dice que se ha planteado un


experimento cuando se establecen determinadas condiciones que conllevan a la aparición de una
respuesta. Un experimento es aleatorio si la aparición de cada una de sus respuestas no se puede
predecir. Sin embargo, el conjunto de todas las respuestas posibles de un experimento aleatorio se
conoce y recibe el nombre de espacio muestral; mientras que cada una de las repuestas contenidas
en él es un punto muestral. El espacio muestral de un experimento aleatorio se simboliza mediante
la letra griega mayúscula Ω, en tanto que los puntos muestrales se simbolizan con la letra griega
minúscula ω, indexada de ser necesario.

EJEMPLO 1.1 Se lanza un dado corriente tres veces consecutivas y se anota la cantidad de puntos en la cara
superior cada vez que el dado se detiene. En este caso, el espacio muestral es

Ω = {(𝑎, 𝑏, 𝑐): 𝑎, 𝑏, 𝑐 ∈ {1, 2, 3, 4, 5, 6}}

EJEMPLO 1.2 Se cuenta la cantidad de veces que se debe lanzar una moneda corriente hasta obtener “sello”
la primera vez. En este caso, el espacio muestral es

Ω = {1, 2, 3, … , ∞} = ℕ ∪ {∞}

EJEMPLO 1.3 Se contabiliza el tiempo que demora una persona en llegar desde cualquier lugar al centro de
la ciudad. En este caso, el espacio muestral es

Ω = [0, ∞)

Un espacio muestral se llama discreto si sus elementos conforman un conjunto finito o enumerable.
Un conjunto es enumerable si se puede establecer una correspondencia biunívoca entre cada uno de
sus elementos y los números de la recta natural. Un experimento aleatorio es finito (discreto) si su
espacio muestral lo es. En ese orden de ideas, los experimentos descritos en los ejemplos 1.1 y 1.2
son discretos.

Supóngase que, en el ejemplo 1.1 es de interés, que las salidas obtenidas en los lanzamientos del
dado sumen más de 16 puntos. Sería deseable disponer de algún tipo de medida que dé cuenta de la
posibilidad de ocurrencia de este evento. Tal como se ha planteado la situación, formalmente un
evento es un subconjunto del espacio muestral. Tal aseveración es cierta para espacios muestrales
discretos, como los descritos en los ejemplos 1.1 y 1.2; mas no lo es para los que no lo son, como el
del ejemplo 1.3, en este caso ni siquiera es posible decir cómo están constituidos todos los
subconjuntos del espacio muestral. Para poder considerar que un subconjunto de algún espacio
muestral es un evento y consecuentemente medir la posibilidad de su ocurrencia, es necesario que
los eventos conformen una estructura de σ-álgebra.

1
TEORÍA BÁSICA DE LA PROBABILIDAD

Sea Ω un espacio muestral no vacío. Una colección ℱ de subconjuntos es una σ-álgebra de eventos
sobre Ω si:
(i) Ω∈ℱ
(ii) Si 𝐴 ∈ ℱ, entonces 𝐴𝑐 ∈ ℱ
(iii) Si 𝐴1 , 𝐴2 , … ∈ ℱ, entonces ⋃∞
𝑖=1 𝐴𝑖 ∈ ℱ

EJEMPLO 1.4 Sea Ω = {1, 2, 3}, entonces ℱ = {∅, {1}, {2, 3}, Ω} es una σ-álgebra sobre Ω, mientras que
𝒢 = {∅, {1}, Ω} no lo es.

EJEMPLO 1.5 Sea Ω ≠ ∅. Las colecciones ℱ = {∅, Ω} y 𝒫(Ω) = {𝐴: 𝐴 ⊆ Ω} son ambas σ-álgebras sobre
Ω, denominadas trivial y total, respectivamente.

Sean Ω ≠ ∅ y ℱ una σ-álgebra sobre Ω. La pareja (Ω, ℱ ) se llama espacio medible.

Es claro que, por la forma como se han definido, ∅ 𝑦 Ω son también eventos; el primero es el evento
imposible, mientras que el segundo es el evento cierto. El evento {𝜔}, para todo 𝜔 ∈ Ω, se llama
elemental. Decir que el evento A ocurre significa que el resultado obtenido al realizar el
experimento aleatorio es un punto de su espacio muestral que a su vez es un elemento de A. Por lo
tanto, si A y B son eventos, entonces:
 AB es un evento que ocurre, si y sólo si A y B ocurren simultáneamente.
 𝐴 ∪ 𝐵 es un evento que ocurre, si y sólo si ocurre A o B exclusivamente u ocurren ambos.
 𝐴𝑐 es un evento que ocurre, si y sólo si no ocurre el evento A.
 𝐴 − 𝐵 es un evento que ocurre, si y sólo si ocurre A y no ocurre B.
 𝐴∆𝐵 es un evento que ocurre, si y sólo si ocurre solamente A o solamente B.

EJEMPLO 1.6 En el ejemplo 1.1, se consideran los eventos 𝐴 ∶=”se obtiene cantidad prima de puntos en el
primer lanzamiento” y 𝐵 ∶=”la suma de los resultados obtenidos es menor o igual que cuatro”. En particular,
las tripletas (2, 1, 1) y (1, 1, 1) son puntos muestrales que verifican la aparición del suceso 𝐴 ∪ 𝐵; así mismo,
la tripleta (2, 1, 1) verifica también la aparición del evento AB y la tripleta (2, 2, 1) valida la aparición del
evento 𝐴 − 𝐵.

Se dice que dos eventos A y B son mutuamente excluyentes o incompatibles si 𝐴𝐵 = ∅. En


particular, los eventos que se complementan mutuamente son incompatibles.

EJEMPLO 1.7 Las salidas “cara” y “sello” cuando se lanza una moneda corriente una vez son eventos
mutuamente excluyentes.

1.1.2 MEDIDA DE PROBABILIDAD

Supóngase que un experimento aleatorio se repite bajo condiciones similares una cantidad finita n
de veces. Para cada evento A se tiene que el número

𝑛𝐴
𝑓𝑟(𝐴) =
𝑛

Se llama frecuencia relativa de aparición del evento A, donde 𝑛𝐴 indica la cantidad de veces que
ocurre el evento A. Es claro que 0 ≤ 𝑓𝑟(𝐴) ≤ 1.

2
TEORÍA BÁSICA DE LA PROBABILIDAD

Desafortunadamente, para A fijo, el número 𝑓𝑟(𝐴) no es constante porque depende de n. Sin


embargo, cuando el experimento aleatorio se realiza una cantidad suficientemente grande de veces,
bajo condiciones similares, la frecuencia relativa 𝑓𝑟(𝐴) se estabiliza alrededor de un valor
específico entre 0 y 1, que se llama la probabilidad de ocurrencia del evento A, se simboliza por
𝑃 (𝐴) y representa la posibilidad o chance que tiene el evento A de ocurrir.

Sea (Ω, ℱ ) un espacio medible. La aplicación P de valor real definida sobre ℱ es una medida de
probabilidad si satisface las siguientes condiciones:
(i) 𝑃 (𝐴) ≥ 0 para todo 𝐴 ∈ ℱ
(ii) 𝑃 (Ω) = 1
(iii) Si 𝐴1 , 𝐴2 , … son eventos tales que 𝐴𝑖 𝐴𝑗 = ∅, para todo 𝑖 ≠ 𝑗, entonces
∞ ∞

𝑃 (⋃ 𝐴𝑘 ) = ∑ 𝑃 (𝐴𝑘 )
𝑘=1 𝑘=1

EJEMPLO 1.8 Sean el espacio muestral finito Ω = {1, 2, 3}, la σ-álgebra ℱ = {∅, Ω, {2}, {1, 3}} y la
aplicación P dada por

1 𝑠𝑖 2 ∈ 𝐴
𝑃(𝐴) = {
0 𝑠𝑖 2 ∉ 𝐴

Es fácil ver que P es una medida de probabilidad sobre (Ω, ℱ ).

La tripleta (Ω, ℱ, 𝑃) se conoce como espacio de probabilidad. Un evento A en un espacio


de probabilidad arbitrario se llama nulo si tiene probabilidad igual a cero. Un espacio de
probabilidad se dice completo si los subconjuntos de eventos nulos son a su vez eventos
nulos. En lo sucesivo, a menos que se indique lo contrario, todos los espacios de
probabilidad se consideran completos.

EJEMPLO 1.9 En el ejemplo 1.8 los eventos ∅ y {1, 3} son nulos. El espacio de probabilidad
correspondiente no es completo porque {1} ⊂ {1, 3}, pero no es un evento.

TEOREMA 1.1 Propiedades de la medida de probabilidad. Sea (Ω, ℱ, 𝑃) un espacio de


probabilidad. Entonces:
(1) 𝑃(∅) = 0
(2) Si A y B son eventos y 𝐴𝐵 = ∅, entonces 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
(3) 𝑃(𝐴𝑐 ) = 1 − 𝑃(𝐴)
(4) 𝑃(𝐴 − 𝐵) = 𝑃(𝐴) − 𝑃(𝐴𝐵)
(5) Si 𝐴 ⊆ 𝐵, entonces 𝑃(𝐴) ≤ 𝑃(𝐵) y 𝑃(𝐵 − 𝐴) = 𝑃(𝐵) − 𝑃(𝐴). En particular, se tiene que
𝑃 (𝐴) ≤ 1 para todo 𝐴 ∈ ℱ
(6) 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴𝐵)
(7) 𝑃(𝐴∆𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 2𝑃(𝐴𝐵)

3
TEORÍA BÁSICA DE LA PROBABILIDAD

Idea de la demostración. Para (1) hacer Ω = Ω ∪ ∅ ∪ ∅ ∪ … y aplicar axiomas de la medida de


probabilidad. Para (2) hacer 𝐴 ∪ 𝐵 = 𝐴 ∪ 𝐵 ∪ ∅ ∪ ∅ ∪ … y aplicar el axioma (iii) de la medida de
probabilidad junto con el resultado (1.1.1). Para (3), tener en cuenta que 𝐴𝑐 ∪ 𝐴 = Ω y aplicar el
axioma (ii) de la medida de probabilidad junto con el resultado (1.1.2). Para (4), tener en cuenta
que 𝐴 = (𝐴 − 𝐵) ∪ 𝐴𝐵 y aplicar el resultado (1.1.2). Para (5), hacer 𝐵 = 𝐴 ∪ (𝐵 − 𝐴) y aplicar el
resultado (1.1.2). Para (6), tener en consideración que 𝐴 ∪ 𝐵 = (𝐴 − 𝐵) ∪ 𝐴𝐵 ∪ (𝐵 − 𝐴) y aplicar
dos veces el resultado (1.1.2). Finalmente, para (7), recordar que 𝐴∆𝐵 = (𝐴 − 𝐵) ∪ (𝐵 − 𝐴) y
aplicar los resultados (1.1.2) y (1.1.4).

Por aplicación del teorema 1.1, se tiene que la probabilidad de aparición de por lo menos uno de los
eventos A, B o C se calcula como sigue

𝑃(𝐴 ∪ 𝐵 ∪ 𝐶 ) = 𝑃 (𝐴) + 𝑃 (𝐵) + 𝑃(𝐶 ) − 𝑃 (𝐴𝐵) − 𝑃(𝐵𝐶 ) − 𝑃 (𝐴𝐶 ) + 𝑃(𝐴𝐵)

Un razonamiento de tipo inductivo conlleva que la probabilidad de aparición de por lo menos uno
de los n eventos 𝐴1 , 𝐴2 , … , 𝐴𝑛 es igual a

𝑃(𝐴1 ∪ 𝐴2 ∪ … ∪ 𝐴𝑛 ) = ∑ 𝑃(𝐴𝑖 ) − ∑ 𝑃(𝐴𝑖1 𝐴𝑖2 ) + ⋯ +


𝑖=1 𝑖1<𝑖2

+(−1)𝑟 ∑ 𝑃(𝐴𝑖1 𝐴𝑖2 … 𝐴𝑖𝑟 ) + (−1)𝑛+1 𝑃 (𝐴1 𝐴2 … 𝐴𝑛 )


𝑖1<𝑖2<⋯<𝑖𝑟

donde la suma

∑ 𝑃(𝐴𝑖1 𝐴𝑖2 … 𝐴𝑖𝑟 )


𝑖1 <𝑖2 <⋯<𝑖𝑟

se toma sobre todos los posibles subconjuntos de tamaño r del conjunto {1, 2, … , 𝑛}.

En un espacio de probabilidad con Ω discreto y ℱ = 𝒫 (Ω), para cualquier evento 𝐴 ≠ ∅ se tiene


que 𝐴 = ⋃𝜔∈𝐴{𝜔} y, por consiguiente

𝑃 (𝐴) = ∑ 𝑃({𝜔})
𝜔∈𝐴

Es decir, la medida de probabilidad P está completamente determinada por las probabilidades 𝑝𝑗 =


𝑃({𝜔𝑗 }), donde 𝜔𝑗 , 𝑗 = 1, 2, …, denotan los puntos muestrales de Ω. Es claro que el vector de

4
TEORÍA BÁSICA DE LA PROBABILIDAD

probabilidades 𝐩 ∶= (𝑝1 𝑝2 … )𝑇 de dimensión #Ω, donde #Ω denota la cantidad de puntos


muestrales en Ω, satisface las condiciones:
(i) 𝑝𝑗 ≥ 0
(ii) ∑∞𝑗=1 𝑝𝑗 = 1

Ahora bien, sea Ω ≠ ∅ un espacio muestral discreto, 𝒫 (Ω) la σ-álgebra total de eventos sobre Ω y p
un vector de probabilidades de dimensión #Ω. Es fácil comprobar que la aplicación P definida
sobre 𝒫 (Ω) dada por:
(i) 𝑃 (∅) = 0
(ii) 𝑃({𝜔𝑗 }) = 𝑝𝑗 , con 𝑗 = 1, 2, …
(iii) 𝑃 (𝐴) = ∑{𝑗:𝜔 𝑝𝑗 para ∅ ≠ 𝐴 ⊆ Ω
𝑗∈𝐴}

es una medida de probabilidad. El espacio de probabilidad (Ω, 𝒫 (Ω), 𝑃 ), en este caso, se llama
discreto.

EJEMPLO 1.10 Sea (Ω, ℱ, 𝑃) un espacio de probabilidad con espacio muestral Ω = {1, 2, 3, 4}; 𝜎 −
álgebra de eventos sobre Ω ℱ = {∅, {1}, {4}, {1, 4}, {2, 3}, {1, 2, 3}, {2, 3, 4}, Ω} y 𝑃({1}) = 𝑃({4}) = 14 y
𝑃({2, 3}) = 12 , entonces 𝑃({1, 2, 3}) = 𝑃({2, 3, 4}) = 34 y 𝑃({1, 4}) = 12 .

EJEMPLO 1.11 Sea (Ω, 𝒫(Ω), 𝑃) un espacio de probabilidad discreto con Ω = {𝑎, 𝑏, 𝑐} y P determinada
2 𝑇
por el vector de probabilidades 𝐩 = (17 4
7
) . Entonces, 𝑃({𝑎, 𝑏}) = 57 , 𝑃({𝑏, 𝑐}) = 67 y 𝑃({𝑎, 𝑐}) = 37 .
7

Un espacio de probabilidad (Ω, ℱ, 𝑃 ) se llama laplaciano si Ω es un conjunto finito, ℱ = 𝒫 (Ω) y


1
𝑃 ({𝜔}) = #Ω para todo 𝜔 ∈ Ω. La medida de probabilidad P se llama laplaciana, uniforme o
clásica. Si (Ω, ℱ, 𝑃 ) es un espacio de probabilidad laplaciano y A es un evento, entonces

1 #𝐴
𝑃(𝐴) = 𝑃 (⋃{𝜔}) = ∑ =
#Ω #Ω
𝜔∈𝐴 𝜔∈𝐴

Es decir, en un espacio de probabilidad laplaciano el cálculo de probabilidades se reduce a contar la


cantidad de elementos de un conjunto finito. O sea, se llega a un problema de análisis
combinatorio.

EJEMPLO 1.12 En una lotería se escogen seis números de 49 posibles. La probabilidad a favor del número
ganador es igual a 𝐶149 = 7.1511 × 10−8. La probabilidad de que 44 sea uno de los números escogidos es
6
𝐶48
igual a 5
𝐶49
= 0.12245
6

1.2 PROBABILIDAD CONDICIONAL

EJEMPLO 1.13 Sea el experimento aleatorio que consiste en lanzar un dado regular una vez y observar la
cantidad de puntos en la cara superior cuando éste se detiene. Sea además el evento 𝐴 ∶=”se obtiene cantidad

5
TEORÍA BÁSICA DE LA PROBABILIDAD

par de puntos”. Si se asume que el espacio de probabilidad de referencia es laplaciano, entonces 𝑃(𝐴) = 12.
Supónganse que se realiza el experimento y se obtiene una cantidad impar de puntos; es claro que, en estas
circunstancias, el evento A nunca va a ocurrir. Supóngase ahora que se realiza el experimento y se obtiene 2 o
4 puntos; bajo estas condiciones es claro que el evento A siempre ocurre. Ahora bien, supóngase que como
resultado del experimento se obtiene más de 4 puntos; en este caso, el evento A ocurre únicamente si se
hubiera obtenido 6 puntos en el lanzamiento. Se aprecia que el evento A se vuelve más o menos probable en
la medida en que se conoce acerca de la ocurrencia de otros eventos.

La probabilidad condicional estima el cambio en el grado de certeza de la ocurrencia de un evento


cuando se tiene información adicional pero incompleta acerca del experimento aleatorio del cual es
respuesta. A continuación se analiza, desde el punto de vista de las frecuencias relativas, la
posibilidad que tiene un evento B de ocurrir cuando se ha observado previamente el evento A. Si el
experimento aleatorio se repite una cantidad finita n de veces, entonces la frecuencia relativa de
ocurrencia del evento B bajo el supuesto de la ocurrencia previa del evento A, se define como

𝑛𝐴𝐵
𝑓𝑟(𝐵|𝐴) ∶= , 𝑛𝐴 > 0
𝑛𝐴

donde 𝑛𝐴𝐵 representa la cantidad de veces que aparecen conjuntamente los eventos A y B. Se
observa que

𝑛𝐴𝐵
𝑛 𝑓𝑟(𝐴𝐵)
𝑓𝑟(𝐵|𝐴) = 𝑛𝐴 = , 𝑛𝐴 > 0
𝑛
𝑓𝑟(𝐴)

Para valores de n suficientemente grandes, las frecuencias relativas que involucra la fórmula
anterior se estabilizan cada una de ellas alrededor de un específico entre 0 y 1, que representan las
probabilidades de ocurrencia respectivas. Este hecho motiva la siguiente definición.

Sea (Ω, ℱ, 𝑃 ) un espacio de probabilidad. Si 𝐴, 𝐵 ∈ ℱ con 𝑃 (𝐴) > 0, entonces la probabilidad


condicional de aparición del evento B dado que el evento A ocurre se define como

𝑃(𝐴𝐵)
𝑃 (𝐵|𝐴) ∶=
𝑃 (𝐴)

EJEMPLO 1.14 Se lanzan dos dados corrientes una vez. Sean los eventos 𝐴 ∶=”por lo menos unos de los
resultados es seis” y 𝐵 ∶=”los resultados son diferentes”. La probabilidad de que al menos uno de los dados
muestre seis cuando que se sabe que se han obtenidos resultados distintos es

𝑃(𝐴𝐵) 10 1
𝑃(𝐵|𝐴) = = 36
30
=
𝑃(𝐴) 36
3

Se presentan a continuación algunas de las propiedades de la probabilidad condicional.

6
TEORÍA BÁSICA DE LA PROBABILIDAD

TEOREMA 1.2 Sea (Ω, ℱ, 𝑃 ) un espacio de probabilidad. Si 𝐴 ∈ ℱ con 𝑃(𝐴) > 0, entonces:
1) 𝑃 (∗ |𝐴) es una medida de probabilidad sobre Ω que está concentrada en A, esto es
𝑃 (𝐴|𝐴) = 1
2) Si 𝐴1 , 𝐴2 , … , 𝐴𝑛 ∈ ℱ con 𝑃(𝐴1 𝐴2 … 𝐴𝑛 ) > 0, entonces

𝑃(𝐴1 𝐴2 … 𝐴𝑛 ) = 𝑃 (𝐴1 )𝑃 (𝐴2 |𝐴1 )𝑃(𝐴3 |𝐴1 𝐴2 ) … 𝑃(𝐴𝑛 |𝐴1 𝐴2 … 𝐴𝑛−1 )

Demostración. 1) Se deben verificar las tres condiciones que caracterizan a una medida de
probabilidad.
(i) Por definición, es claro que 𝑃 (𝐵|𝐴) ≥ 0, para todo 𝐵 ∈ ℱ.
𝑃(Ω𝐴) 𝑃(𝐴)
(ii) 𝑃 (Ω|𝐴) = 𝑃(𝐴)
= 𝑃(𝐴) = 1. Análogamente se prueba que 𝑃(𝐴|𝐴) = 1.
(iii) Sean 𝐴1 , 𝐴2 , … ∈ ℱ eventos incompatibles dos a dos, entonces

∞ 1 ∞ 1 ∞
𝑃 [(⋃ 𝐴𝑘 ) |𝐴] = 𝑃 [𝐴 (⋃ 𝐴𝑘 )] = 𝑃 (⋃ 𝐴𝐴𝑘 ) =
𝑘=1 𝑃 (𝐴) 𝑘=1 𝑃(𝐴) 𝑘=1

∞ ∞
1
= ∑ 𝑃 (𝐴𝐴𝑘 ) = ∑ 𝑃(𝐴𝑘 |𝐴)
𝑃 (𝐴)
𝑘=1 𝑘=1

2) Teniendo en cuenta que el producto de eventos es asociativo, entonces aplicando la definición de


probabilidad condicional se tiene que:

𝑃(𝐴1 𝐴2 … 𝐴𝑛 ) = 𝑃[(𝐴1 𝐴2 … 𝐴𝑛−1 )𝐴𝑛 ] = 𝑃(𝐴𝑛 |𝐴1 𝐴2 … 𝐴𝑛−1 )𝑃(𝐴1 𝐴2 … 𝐴𝑛−1 ) =

= 𝑃 (𝐴𝑛 |𝐴1 𝐴2 … 𝐴𝑛−1 )𝑃 (𝐴𝑛−1 |𝐴1 𝐴2 … 𝐴𝑛−2 )𝑃(𝐴1 𝐴2 … 𝐴𝑛−2 ) =…

… = 𝑃 (𝐴𝑛 |𝐴1 𝐴2 … 𝐴𝑛−1 )𝑃 (𝐴𝑛−1 |𝐴1 𝐴2 … 𝐴𝑛−2 ) … 𝑃 (𝐴2 |𝐴1 )𝑃(𝐴1 )

EJEMPLO 1.15 Se extraen al azar tres cartas sin reposición de una baraja convencional de 52 cartas. Sean
los eventos 𝐴𝑖 ∶=”se extrae un corazón en el i-ésimo intento”, con i = 1, 2 o 3. Luego, la probabilidad de
extraer tres corazones es igual a

13 12 11
𝑃(𝐴1 𝐴2 𝐴3 ) = 𝑃(𝐴1 )𝑃 (𝐴2 |𝐴1 )𝑃(𝐴3 |𝐴1 𝐴2 ) = × × = 0.0129
52 51 50

TEOREMA 1.3 Teorema de la probabilidad completa. Sea (Ω, ℱ, 𝑃 ) un espacio de probabilidad. Sea
además 𝐴1 , 𝐴2 , … una partición finita del espacio muestral Ω en eventos tales que
(i) 𝐴𝑖 𝐴𝑗 = ∅ para todo 𝑖 ≠ 𝑗
(ii) ⋃∞𝑘=1 𝐴𝑘 = Ω
(iii) 𝑃 (𝐴𝑖 ) > 0 pata todo i

7
TEORÍA BÁSICA DE LA PROBABILIDAD

Luego, para cualquier 𝐵 ∈ ℱ, se satisface que

𝑃(𝐵) = ∑ 𝑃(𝐴𝑘 ) 𝑃 (𝐵|𝐴𝑘 )


𝑘

Demostración.

𝑃 (𝐵) = 𝑃(𝐵Ω) = 𝑃 [⋃(𝐵𝐴𝑘 )] = ∑ 𝑃 (𝐵𝐴𝑘 ) = ∑ 𝑃(𝐴𝑘 ) 𝑃 (𝐵|𝐴𝑘 )


𝑘 𝑘 𝑘

COROLARIO. Fórmulas de Bayes. Bajo las condiciones del teorema de la probabilidad completa,
para todo 𝐵 ∈ ℱ con 𝑃 (𝐵) > 0 se satisface que

𝑃(𝐴𝑘 )𝑃(𝐵|𝐴𝑘 )
𝑃 (𝐴𝑘 |𝐵) =
∑𝑘 𝑃 (𝐴𝑘 ) 𝑃(𝐵|𝐴𝑘 )

Demostración.

𝑃 (𝐵𝐴𝑘 ) 𝑃 (𝐴𝑘 )𝑃(𝐵|𝐴𝑘 )


𝑃 (𝐴𝑘 |𝐵) = =
𝑃 (𝐵) ∑𝑘 𝑃(𝐴𝑘 ) 𝑃 (𝐵|𝐴𝑘 )

Como la aparición de cualquiera de los eventos 𝐴𝑘 afecta el grado de certeza en la aparición del
evento B, entonces las fórmulas de Bayes permiten evaluar cuál de los eventos 𝐴𝑘 produjo más
probablemente la aparición de B.

EJEMPLO 1.16 Se tienen dos balotas negras y tres blancas en una primera urna. Una segunda urna contiene
dos blancas y cuatro negras. Se escoge una balota al azar de una urna escogida al azar. Sean los eventos 𝐴𝑖
∶=”se escoge la i-ésima urna”, con i = 1 o 2, y 𝐵 ∶=”se escoge una balota negra”. Entonces, de acuerdo con el
teorema de la probabilidad total, la probabilidad de escoger una balota negra de cualquiera de las urnas es
igual a

1 2 4
𝑃(𝐵) = 𝑃(𝐴1 )𝑃(𝐵|𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐵|𝐴2 ) = × ( + ) = 0.533
2 5 6

Aproximadamente en el 53% del total de intentos se obtiene una balota negra de una urna escogida al azar.
Ahora bien, supóngase que ya se extrajo una balota negra, según las fórmulas de Bayes, la probabilidad de
que haya sido extraída de la primera urna es

2
𝑃(𝐴1 )𝑃(𝐵|𝐴1 )
𝑃(𝐴1 |𝐵) = = 5 = 0.375
𝑃(𝐴1 )𝑃(𝐵|𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐵|𝐴2 ) 25+46

8
TEORÍA BÁSICA DE LA PROBABILIDAD

Análogamente, la probabilidad de que la balota negra haya sido extraída de la segunda urna es

4
𝑃(𝐴2 )𝑃(𝐵|𝐴2 )
𝑃(𝐴2 |𝐵) = = 2 6 4 = 0.625
𝑃(𝐴1 )𝑃(𝐵|𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐵|𝐴2 ) 5+6

Como se puede observar el hecho de saber que la balota escogida es negra aumenta la certidumbre de haya
salido de la segunda urna.

1.3 INDEPENDENCIA DE EVENTOS

Sea (Ω, ℱ, 𝑃 ) un espacio de probabilidad. Dos eventos A y B son independientes, si y solamente si

𝑃(𝐴|𝐵) = 𝑃(𝐴) o 𝑃(𝐵|𝐴) = 𝑃(𝐵)

Es decir, la probabilidad de ocurrencia de uno de los eventos no se afectada por la ocurrencia del
otro. En caso contrario, se dice que los eventos son dependientes.

De la definición de probabilidad condicional, se deduce que la aparición conjunta de dos eventos A


y B que son independientes es igual a

𝑃(𝐴𝐵) = 𝑃(𝐴)𝑃(𝐵)

EJEMPLO 1.17 Se extrae una carta de una baraja convencional y se observa qué carta es. Los eventos 𝐴
∶=”la carta escogida es un rey” y 𝐵 ∶=”la carta escogida es un trébol” son independientes, pues

13 4 1
𝑃(𝐴)𝑃(𝐵) = × = = 𝑃(𝐴𝐵)
52 52 52

Una familia {𝐴𝑖 : 𝑖 ∈ 𝐼} de eventos se dice completamente independiente, si y solamente si

𝑃 (⋂ 𝐴𝑖 ) = ∏ 𝑃(𝐴𝑖 )
𝑖∈𝐽 𝑖∈𝐽
para 𝐽 ⊂ 𝐼 finito.

Una familia {𝐴𝑖 : 𝑖 ∈ 𝐼} de eventos se dice independiente dos a dos, si y solamente si

𝑃(𝐴𝑖 𝐴𝑗 ) = 𝑃(𝐴𝑖 )𝑃(𝐴𝑗 ) para todo 𝑖 ≠ 𝑗

La independencia dos a dos de una familia de eventos no garantiza la independencia completa de la


familia.

9
TEORÍA BÁSICA DE LA PROBABILIDAD

EJEMPLO 1.18 Se lanza un dado corriente dos veces y cada vez que se detiene se anota la cantidad de
puntos en la cara visible. Sean los eventos 𝐴 ∶=”se obtuvo dos puntos en el primer lanzamiento”, 𝐵 ∶=”se
obtuvo cinco puntos en el segundo lanzamiento” y 𝐶 ∶=”la suma de los resultados es siete”. Es claro que

1
𝑃 (𝐴) = 𝑃(𝐵) = 𝑃(𝐶 ) =
6

1
𝑃 (𝐴𝐵) = 𝑃 (𝐵𝐶 ) = 𝑃(𝐴𝐶 ) =
36

1
𝑃(𝐴𝐵𝐶 ) =
36

Por tanto, los eventos son independientes dos a dos, pero no forman una familia completamente
independiente.

10