Está en la página 1de 13

Probabilidad condicional

Introducción
En el análisis de datos es fundamental encontrar siempre la forma de ordenar la
información. Los diagramas de Venn y las tablas de contingencia son buenas técnicas.
En esta lectura exploramos una nueva herramienta llamada diagramas de árbol para
tratar el tema probabilidad condicional. Supongamos que tenemos un experimento
aleatorio con espacio muestral 𝑆 y que 𝐴, 𝐵 son eventos en 𝑆 . Abordaremos la
pregunta de cómo se afecta la probabilidad de que suceda 𝐵 si de antemano ha
ocurrido el evento 𝐴. Así pues, en términos formales exploramos los conceptos de
probabilidad condicional, teoremas de la probabilidad condicional y eventos
independientes. Cerraremos la lectura con dos teoremas muy importantes: teorema
de la probabilidad total y teorema de Bayes.
1. Caso
La empresa Tornillos del Norte posee dos máquinas productoras de tornillos. Una
máquina antigua que produce el 45 % de los tornillos y una máquina nueva que
produce el resto. De la máquina más antigua el 15 % de tornillos resultan defectuosos
y de la máquina más nueva el 25 % de tornillos resultan defectuosos. Una tercera
máquina elige un tornillo al azar. Hallar
1. La probabilidad de que el tornillo sea defectuoso y que sea de la máquina
más antigua.
2. La probabilidad de que el tornillo salga defectuoso.
3. La probabilidad de que el tornillo sea de la máquina más nueva dado que
salió defectuoso.

Comentario 1. Debemos entender qué sucede en un espacio muestral 𝑆 cuando


introducimos información sobre el hecho que un evento 𝐵 haya sucedido. Esto es,
nos preguntamos por la probabilidad de ocurrencia de un evento 𝐴, sabiendo de
antemano que el evento 𝐵 haya ocurrido. Esta idea es la del concepto de probabilidad
condicional.

Definición 1. Supongamos que 𝑆 es un espacio muestral y que sabemos que un


evento 𝐵 ocurrió y sea 𝐴 otro evento cualquiera del espacio muestral. Definimos el
evento 𝐴 dado 𝐵 que denotamos por 𝐴|𝐵 al evento que ocurra 𝐴 conociendo de
antemano que 𝐵 ocurrió.

Comentario 2. Supongamos que tenemos un espacio muestral 𝑆 con dos eventos.


Pensemos que los eventos ocurren en el tiempo en una línea temporal. Si un evento
𝐵 ocurre, entonces, agregamos una segmento para indicar su ocurrencia

Figura 1: Evento 𝐵 en una línea de tiempo


Fuente: elaboración propia.

Descripción de la figura 1: Ilustramos en una rama de un diagrama de árbol al evento


𝐵 una vez ocurrido.

Además, si un evento 𝐴 ocurre luego de que 𝐵 haya ocurrido, entonces nos vemos en
la necesidad de hablar del evento 𝐴|𝐵. Así pues, anexamos un nuevo segmento a la
línea de tiempo.

Figura 2: Eventos 𝐵 y 𝐴 en una línea de tiempo

Fuente: elaboración propia.

Descripción de la figura 2: ilustramos en dos ramas de un diagrama de árbol al


evento 𝐴 sabiendo que previamente ha ocurrido el evento 𝐵.

Así damos una idea gráfica del orden en que ocurren los eventos.

Ejemplo 1. Supongamos en la situación de la empresa Tornillos del norte, que


elegimos un tornillo y determinamos de qué máquina proviene en un primer momento.
Ahora bien, podemos definir el evento

𝐴: 𝐸𝑙 𝑡𝑜𝑟𝑛𝑖𝑙𝑙𝑜 𝑓𝑢𝑒 𝑐𝑟𝑒𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑚á𝑞𝑢𝑖𝑛𝑎 𝑎𝑛𝑡𝑖𝑔𝑢𝑎

Y, naturalmente, tenemos el complemento

𝐴𝑐 : 𝐸𝑙 𝑡𝑜𝑟𝑛𝑖𝑙𝑙𝑜 𝑓𝑢𝑒 𝑐𝑟𝑒𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑚á𝑞𝑢𝑖𝑛𝑎 𝑛𝑢𝑒𝑣𝑎.

Una vez que determinamos la máquina de origen, podemos considerar el evento:

𝐷 = 𝐸𝑙 𝑡𝑜𝑟𝑛𝑖𝑙𝑙𝑜 𝑒𝑠 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜,

O bien

𝐷𝑐 = 𝐸𝑙 𝑡𝑜𝑟𝑛𝑖𝑙𝑙𝑜 𝑒𝑠𝑡á 𝑒𝑛 𝑏𝑢𝑒𝑛 𝑒𝑠𝑡𝑎𝑑𝑜.


Ahora bien, si conocemos que la máquina de donde proviene el tornillo es la máquina
más antigua, estamos ante el evento: el tornillo es defectuoso dado que proviene de
la máquina antigua, o bien:

𝐷|𝐴.

Si, por el contrario, conocemos que la máquina de donde proviene el tornillo es la


máquina nueva, estamos ante el evento: el tornillo es defectuoso dado que proviene
de la máquina nueva, o bien

𝐷|𝐴𝑐 .

Naturalmente, el tornillo puede estar en buen estado, y si conocemos que la máquina


de donde proviene el tornillo es la máquina más antigua, estamos ante el evento

𝐷𝑐 |𝐴.

Si, por el contrario, el tornillo puede estar en buen estado, y si conocemos que la
máquina de donde proviene el tornillo es la máquina nueva, estamos ante el evento

𝐷𝑐 |𝐴𝑐 .

Podemos resumir esta estructura de eventos en un diagrama de árbol como sigue:

Figura 3: Eventos 𝐴 y 𝐷 en una línea de tiempo


Fuente: elaboración propia.

Descripción de la figura 3: ilustramos en un diagrama de árbol las posibilidades en


la línea de tiempo entre los eventos 𝐴 y 𝐷 sabiendo que previamente evaluamos la
ocurrencia del evento 𝐴.

Comentario 3. La pregunta natural es cómo podemos calcular una probabilidad de un


evento condicionado. Cuando el espacio muestral es finito es relativamente sencillo
poder realizar el cálculo. Pero, cuando no es finito, entonces debemos recurrir a algo
más general que presentamos a continuación.

Definición 2. Sea 𝑆 un espacio muestral, 𝐴 y 𝐵 eventos de 𝑆 . La probabilidad


condicional de un evento 𝐴 dado un evento 𝐵, está definida por

𝑃(𝐴 𝑦 𝐵)
𝑃(𝐵) = .
𝑃(𝐵)

𝑃(𝐴|𝐵) se lee como Probabilidad de 𝐴 dado 𝐵.

Comentario 4. El siguiente teorema nos enseña a calcular probabilidades


condicionales. En términos generales, surge de realizar un despeje en ecuación de la
definición anterior.

Teorema 1. (Regla de la multiplicación). Para cualquier par de eventos 𝐴 y 𝐵 de un


espacio muestral 𝑆 . Entonces

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵)𝑃(𝐴|𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴)

Tabla 1. Elementos
TÉRMINO FÓRMULA

Probabilidad condicional de un evento 𝑃(𝐴 𝑦 𝐵)


𝑃(𝐴|𝐵) =
𝐴 dado un evento 𝐵 𝑃(𝐵)

Teorema de la multiplicación 𝑃(𝐴 𝑦 𝐵) = 𝑃(𝐵)𝑃(𝐴|𝐵)


= 𝑃(𝐴)𝑃(𝐵|𝐴)
Fuente: elaboración propia.

Comentario 5. Si en vez de enunciar a los eventos en los segmentos enunciamos a


sus probabilidades, entonces tenemos que

Figura 4. Probabilidades de eventos 𝐵 y 𝐴 en una línea de tiempo

Fuente: elaboración propia.

Descripción de la figura 4: ilustramos en las ramas de un diagrama de árbol las


posibilidades en la línea de tiempo entre los eventos 𝐵 y 𝐴 sabiendo que previamente
evaluamos la ocurrencia del evento 𝐵.

La regla de la multiplicación nos dice que para hallar la probabilidad de intersección


de los eventos 𝐴 y 𝐵 debemos multiplicar simplemente los números que hemos
puesto en los segmentos de la línea de tiempo.

Ejemplo 2. Retomemos el caso y notemos que: la máquina antigua que produce el


45% de los tornillos y además, de ella el 15% de tornillos resultan defectuosos. Esto
significa que
𝑃[𝐴] = 0.45

Y, además,
𝑃[𝐴] = 0.15

Entonces, para hallar la probabilidad de que el tornillo sea defectuoso y que sea de la
máquina más antigua debemos encontrar
𝑃[𝐴 ∩ 𝐷].
Consideramos el siguiente diagrama:

Figura 5: Diagrama de árbol relativo los eventos 𝐴 y 𝐷

Fuente: elaboración propia.

Descripción de la figura 5: ilustramos en la rama de un diagrama de árbol las


posibilidades en la línea de tiempo entre los eventos 𝐴 y 𝐷 sabiendo que previamente
evaluamos la ocurrencia del evento 𝐴 y, luego, solo la ocurrencia del evento 𝐷. Esta
información es necesaria para aplicar el teorema de la multiplicación.

Por el teorema de la multiplicación tenemos que

𝑃(𝐴 ∩ 𝐷) = 𝑃[𝐴]𝑃[𝐷|𝐴] = 0.45 ∗ 0.15 = 0.0675

Ejemplo 3. Podemos expandir el diagrama 𝐴𝑐 dado por: el tornillo proviene de la


máquina nueva, tenemos que:
𝑃[𝐴𝑐 ] = 1 − 𝑃[𝐴] = 1 − 0.45 = 0.55

Por otro lado, de la máquina más nueva el 25 % de tornillos resultan defectuosos.


Esto es
𝑃[𝐷|𝐴𝐶 ] = 0.25.

Así, podemos representar de siguiente manera la información:

Figura 6. Diagrama de árbol relativo al evento 𝐷


Fuente: elaboración propia.

Descripción de la figura 6: ilustramos en las ramas de un diagrama de árbol las


posibilidades en la línea de tiempo entre los eventos 𝐴 y 𝐷 sabiendo que previamente
evaluamos la ocurrencia del evento 𝐴 y luego solo la ocurrencia del evento 𝐷.

El evento: que un tornillo sea defectuoso y sea de la máquina nueva es

1. 𝑃[𝐴𝑐 ∩ 𝐷] (Correcta)
2. 𝑃[𝐴𝑐 ∪ 𝐷]
3. 𝑃[𝐴 ∩ 𝐷]
4. 𝑃[𝐴𝑐 ∩ 𝐷𝑐 ]
5. 𝑃[𝐴𝑐 |𝐷]

JUSTIFICACIÓN: que un tornillo sea defectuoso y sea de la máquina nueva es el


evento 𝐷 intersectado 𝐴𝑐 , por tanto, tenemos 𝐷 ∩ 𝐴𝑐 .

Según el diagrama

Figura 7. Ejercicio
Fuente: elaboración propia.
La probabilidad de 𝑃[𝐴𝑐 ∩ 𝐷] es

1. 0.1375 Correcta
2. 0.55
3. 0.25
4. 0.15
5. 0.7523

JUSTIFICACIÓN: basta aplicar la regla de la multiplicación y obtener

𝑃[𝐴𝑐 ∩ 𝐷] = 𝑃[𝐴𝑐 ]𝑃[𝐴𝑐 ] = 0.55 ∗ 0.25 = 0.1375

Comentario 6. Un teorema muy importante para trabajar con probabilidades


condicionales es el teorema de la probabilidad total. Para poder presentarlo
necesitamos un concepto previo que introducimos a continuación.

Definición 3. Supongamos que 𝑆 es un espacio muestral. Sea 𝐴1 , 𝐴2 , … , 𝐴𝑘 una


familia de eventos de 𝑆. Diremos que esta familia de eventos es una partición de 𝑆 si

● 𝐴1 , 𝐴2 , … , 𝐴𝑘 son mutuamente excluyentes dos a dos. Es decir, para cualquier


elección de dos eventos 𝐴𝑖 y 𝐴𝑗 distintos de la lista, ellos son mutuamente
excluyentes, o bien si 𝑖 ≠ 𝑗 , entonces,
𝐴𝑖 ∩ 𝐴𝑗 = ∅.

● 𝐴1 , 𝐴2 , … , 𝐴𝑘 son exhaustivos en el sentido su unión alcanza a todo el espacio


muestral, es decir,
𝑆 = 𝐴1 ∪ 𝐴2 ∪ ⋯ ∪ 𝐴𝑘 .
Ejemplo 4. En nuestra situación los eventos 𝐴 y 𝐴𝑐 son precisamente una partición
del espacio muestral, ya que son complementarios y su unión es 𝑆.

Teorema 2. (Teorema de la probabilidad total). Sea 𝑆 un espacio muestral. Sean


𝐴1 , . . . , 𝐴𝑘 eventos mutuamente excluyentes y exhaustivos. Entonces, para cualquier
otro evento B tenemos que:
𝑘

𝑃(𝐵) = ∑ 𝑃(𝐴𝑖 )𝑃(𝐵|𝐴𝑖 )


𝑖=1

Ejemplo 5. Encontremos la probabilidad de que un tornillo salga defectuoso. Es claro


que 𝐴, 𝐴𝑐 conforman una partición del espacio muestral. También podemos notar que
deseamos calcular la probabilidad del evento 𝐷. Por lo tanto, aplicaremos el teorema
de la probabilidad total al evento 𝐷 y a la partición
𝐴1 = 𝐴, 𝐴2 = 𝐴𝑐 .

Y, en consecuencia, obtenemos que


𝑃[𝐷] = 𝑃[𝐴]𝑃[𝐴] + 𝑃[𝐴𝑐 ]𝑃[𝐴𝑐 ].

Ahora bien, consideramos el diagrama:

Figura 8. Diagrama de árbol relativo al evento 𝐷 para el teorema de la


probabilidad total

Fuente: elaboración propia.

Descripción de la figura 8: ilustramos en las ramas de un diagrama de árbol las


posibilidades en la línea de tiempo entre los eventos 𝐴 y 𝐷 sabiendo que previamente
evaluamos la ocurrencia del evento 𝐴 y, luego, solo la ocurrencia del evento 𝐷. Este
diagrama aporta toda la información para poder aplicar el teorema de la probabilidad
total.

Obtenemos toda la información necesaria y, en consecuencia,


𝑃(𝐴) = 𝑃[𝐴]𝑃[𝐴] + 𝑃[𝐴𝑐 ]𝑃[𝐴𝑐 ] . = 0.45 × 0.15 + 0.55 × 0.25 = 0.205

En consecuencia, la probabilidad de obtener un tornillo defectuoso es de 0.205.

Comentario 7. Otro teorema muy importante para trabajar con probabilidades


condicionales es el teorema de Bayes. Surge de una aplicación directa de las reglas
del producto y del teorema de la probabilidad total y lo enunciamos a continuación.

Teorema 3. (Teorema de Bayes). Sea 𝑆 un espacio muestral. Sean 𝐴1 , . . . , 𝐴𝑘


eventos mutuamente excluyentes y exhaustivos. Entonces, para cualquier otro evento
B, si 𝑃(𝐵) > 0, entonces,

𝑃[𝐴𝑗 ]𝑃[𝐵|𝐴𝑗 ]
𝑃[𝐵] =
∑𝑘𝑖=1 𝑃[𝐴𝑖 ]𝑃[𝐵|𝐴𝑖 ]

Ejemplo 6. Para encontrar la probabilidad de que el tornillo sea de la máquina nueva,


dado que salió defectuoso, debemos calcular 𝑃[𝐴𝑐 |𝐷]. Aplicaremos el teorema de
Bayes con
𝐴1 = 𝐴, 𝐴2 = 𝐴𝐶 , 𝐵 = 𝐷

y tenemos que

𝑃[𝐴𝑐 ]𝑃[𝐷|𝐴𝑐 ]
𝑃[𝐴𝑐 |𝐷] =
𝑃[𝐴]𝑃[𝐴] + 𝑃[𝐴𝑐 ]𝑃[𝐷|𝐴𝑐 ]

Ahora bien, siguiendo la información del diagrama

Figura 9. Diagrama de árbol relativo al evento 𝐷 para el teorema de Bayes


Fuente: elaboración propia.

Descripción de la figura 9: ilustramos en las ramas de un diagrama de árbol las


posibilidades en la línea de tiempo entre los eventos 𝐴 y 𝐷, sabiendo que previamente
evaluamos la ocurrencia del evento 𝐴 y, luego, solo la ocurrencia del evento 𝐷. Este
diagrama aporta toda la información para poder aplicar el teorema de Bayes.

Tenemos que

𝑐
𝑃[𝐴𝑐 ]𝑃[𝐷|𝐴𝑐 ] 0.55 ∗ 0.25
𝑃[𝐴 |𝐷] = = = 0.6707
𝑃[𝐴]𝑃[𝐴] + 𝑃[𝐴𝑐 ]𝑃[𝐷|𝐴𝑐 ] 0.45 ∗ 0.15 + 0.55 ∗ 0.25
Referencias
Veritasium en español [Veritasium en español], (s. f.). Cómo Escapar de la Trampa
Bayesiana [YouTube]. https://www.youtube.com/watch?v=D7KKlC0LOyw

También podría gustarte