Está en la página 1de 13

TEOREMA DE BAYES Y DIAGRAMA DEL ÁRBOL

El teorema de Bayes es utilizado para calcular la probabilidad de un suceso, teniendo información de


antemano sobre ese suceso.

Podemos calcular la probabilidad de un suceso A, sabiendo además que ese A cumple cierta característica
que condiciona su probabilidad. El teorema de Bayes entiende la probabilidad de forma inversa al teorema
de la probabilidad total. El teorema de la probabilidad total hace inferencia sobre un suceso B, a partir de los
resultados de los sucesos A. Por su parte, Bayes calcula la probabilidad de A condicionado a B.

El teorema de Bayes ha sido muy cuestionado. Lo cual se ha debido, principalmente, a su mala aplicación.
Ya que, mientras se cumplan los supuestos de sucesos disjuntos y exhaustivos, el teorema es totalmente
válido.

Fórmula del teorema de Bayes


Para calcular la probabilidad tal como la definió Bayes en este tipo de sucesos, necesitamos una fórmula. La
fórmula se define matemáticamente como:

Donde B es el suceso sobre el que tenemos información previa y A(n) son los distintos sucesos
condicionados. En la parte del numerador tenemos la probabilidad condicionada, y en la parte de abajo la
probabilidad total. En cualquier caso, aunque la fórmula parezca un poco abstracta, es muy sencilla. Para
demostrarlo, utilizaremos un ejemplo en el que en lugar de A(1), A(2) y A(3), utilizaremos directamente A, B
y C.

Ejemplo del teorema de Bayes


Una empresa tiene una fábrica en Estados Unidos que dispone de tres máquinas A, B y C, que producen
envases para botellas de agua. Se sabe que la máquina A produce un 40% de la cantidad total, la máquina B
un 30% , y la máquina C un 30%. También se sabe que cada máquina produce envases defectuosos. De tal
manera que la máquina A produce un 2% de envases defectuosos sobre el total de su producción, la
máquina B un 3%, y la máquina C un 5%. Dicho esto, se plantean dos cuestiones:

P(A) = 0,40 P(D/A) = 0,02

P(B) = 0,30 P(D/B) = 0,03

P(C) = 0,30 P(D/C) = 0,05

1.Si un envase ha sido fabricado por la fábrica de esta empresa en Estados Unidos ¿Cuál es la probabilidad
de que sea defectuoso?

Se calcula la probabilidad total. Ya que, a partir los diferentes sucesos, calculamos la probabilidad de que sea
defectuoso.

P(D) =[ P(A) x P(D/A) ] + [ P(B) x P(D/B) ] + [ P(C) x P(D/C) ] = [ 0,4 x 0,02 ] + [ 0,3 x 0,03 ] + [ 0,3 x
0,05 ] = 0,032

Expresado en porcentaje, diríamos que la probabilidad de que un envase fabricado por la fábrica de esta
empresa en Estados Unidos sea defectuoso es del 3,2%.
2. Siguiendo con la pregunta anterior, si se adquiere un envase y este es defectuoso ¿Cuáles es la
probabilidad de que haya sido fabricado por la máquina A?¿Y por la máquina B?¿Y por la máquina C?

Aquí se utiliza el teorema de Bayes. Tenemos información previa, es decir, sabemos que el envase es
defectuoso. Claro que, sabiendo que es defectuoso, queremos saber cual es la probabilidad de que se haya
producido por una de las máquinas.

P(A/D) = [P(A) x P(D/A)] / P(D) = [0,40 x 0,02] / 0,032 = 0,25

P(B/D) = [P(B) x P(D/B)] / P(D) = [0,30 x 0,03] / 0,032 = 0,28

P(C/D) = [P(C) x P(D/C)] / P(D) = [0,30 x 0,05] / 0,032 = 0,47

Sabiendo que un envase es defectuoso, la probabilidad de que haya sido producido por la máquina A es del
25%, de que haya sido producido por la máquina B es del 28% y de que haya sido producido por la máquina
C es del 47%.

Generar Diagramas de Arbol

Para empezar, seleccione usted mismo parámetros de la siguiente aplicación


y genere un diagrama de árbol, dado que serán la base de los experimentos
que haremos para desarrollar el concepto.

Aplicación Generadora de Diagramas de Árbol


Evento 1 Evento2 Evento 3
Ramas
Carriles Sub Ramas
Condicionales
1234567891 12345 0123
0 4

Prologo

Introducción

Bueno, el presente artículo intenta enseñar el Teorema de Bayes basado


centralmente en diagramas de árbol, sin asustarnos por la expresión de sus fórmulas,
conceptos y notación, que son impresionantemente complejas cuando la vemos por
primera vez. Aún más, sin tener aun mucha comprensión de cuál es su utilidad y de
verse obligados a aprender desmenuzando nomenclaturas complejas.

Seré uno más de los que intentan mejorar la reputación de Thomas Bayes ayudado
por el enfoque intuitivo de Paul Halmos, de modo que partiré con el simple y
frecuente ejemplo de dos buzones con bolitas de colores y su correspondiente
diagrama de árbol, para explicar haciendo un experimento de probabilidades
condicionales e ir introduciendo paulatinamente ciertos conceptos formales.

Después ingresar del mismo modo al cálculo de Bayes, con varios ejemplos y un
segmento de una aplicación computacional DocIRS (con javascript), para generar
árboles mediante ingreso de parámetros (Ver Aplicación Generadora de Arboles) .
Finalmente mostrar la formalización matemática del Teorema de Bayes, para lo cual
Internet está repleto de documentación, videos, aplicaciones y bibliografía, en
investigación médica, Teoría de Juegos y las más diversas áreas del conocimiento.
Obviamente incluyendo Wikipedia.

Aprenderemos dibujando el diagrama de árbol. Recuerden el enunciado de un


problema siempre debe tener los datos de base explícitos o implícitos. En su trabajo,
es probable que no siempre tengan data empírica para determinadas variables, pero
si tienen el conocimiento del comportamiento, pueden asumir valores a priori que
posteriormente podrán irse ajustando.

Finalizaremos con una conclusión basada en la experiencia de la empresa DocIRS en


tratamiento estadístico de datos y un anexo con pautas para el lector.

Ver Datos y Trucos / Diagramación de Arboles en d3noob.org

I. Concepto a través de dos Buzones

Experimento 1

Se tienen dos buzones. El Buzón 1 con 3 bolitas negras y 2 rojas. El Buzón 2, con 4
negras y 3 rojas.

Dibujo 1

El experimento aleatorio que utilizaremos, consiste en sacar una bolita del primer
buzón e introducirla en el segundo, para después extraer una bolita de este último
buzón y ahí preguntar probabilidades de ocurrencia. El hecho de sacar una bolita lo
llamaremos evento, cuya probabilidad es siempre diferente de cero. (El experimento
tiene como condición, siempre sacar una bolita)
Dibujo 2

• Primer evento: Sacar una bolita del Buzón 1, esta acción puede seguir dos carriles:
Comenzar sacando una bolita de color Negro o sacar una de color Rojo.
Inmediatamente introducirla en el Buzón 2. En ambas situaciones, se aumenta en
una bolita el espacio muestral o número total de bolitas del segundo buzón.

• Segundo evento: Sacar una bolita del Buzón 2,- después de haber introducido la
bolita que proviene del Buzón 1, - la cual también sigue los dos mismos carriles (N o
R)-,

Pregunta: ¿Cuál es la probabilidad que sea roja?

Para responder esta pregunta, se construye un diagrama en árbol, donde se definen


dos carriles, y se asocia la probabilidad cada a cada rama. Nótese que Cada carril
cuenta con dos ramas. (Utilizar Aplicación Generadora de Arboles con parámetros
(2,2,0) para dibujarlo).
Diagrama 1

En el diagrama de árbol a continuación, asociamos las probabilidades a cada rama.

Diagrama 2

Primero se definen los eventos o sucesos con una notación clara:


Evento 1

i) Suceso N: Sacar una bolita negra, probabilidad 3/5)


ii) Suceso R: Sacar una bolita roja, probabilidad 2/5)

De ahí, utilizaremos la notación convencional, sobre el segundo evento


condicionado:

Evento 2 (i)
• Sacar una bolita negra cuando la primera fue negra, N/N
• Sacar una bolita roja cuando la primera fue negra, N/R

Evento 2 (ii)
• Sacar una bolita negra cuando la primera fue roja, R/N
• Sacar una bolita roja cuando la primera fue roja, R/R

Después marcamos con un circulo rojo cada uno de los rojos posibles de sacar del
Buzón 2.

A partir del diagrama, calculamos la probabilidad de sacar una bolita roja del Buzón
2, dado el experimento en cuestión. Respondiendo la pregunta formulada: ¿Cuál es
la probabilidad que sea roja?

(Nótese que esto significa que primero calcularemos la Probabilidad Total del sacar
una bolita roja)

La regla de ir calculando la probabilidad total de un experimento condicionado,


basado en el diagrama de árbol es simple y ordenado. Cuando vamos por un carril
(ramas consecutivas), se van multiplicando las probabilidades asociadas a las ramas.
(conectiva booleanaconjunción y).

Diagrama3 (Ver Teorema de la Multiplicación)

Enseguida en el diagrama , nos movemos por el Carril Rojo y usamos la regla de la


suma. Es decir, cuando bifurcan los carriles, entonces se debe sumar las
probabilidades (conectiva booleana v, disyunción o) . De ese modo llegamos al
suceso bolita Roja, usando regla de la multiplicación y la regla de la suma.
Diagrama 4 (Regla de la Adición)

Nótese que la suma de las probabilidades de las ramas bifurcadas siempre debe
sumar 1.

Ahora, veamos qué se preguntaría el reverendo Thomas Bayes, autor del Teorema
que analizaremos más adelante:

¿Cuál es la probabilidad de sacar una bolita roja del segundo buzón, dado que la
primera bolita fue negra?

Llamemos PB(N/R) a esta probabilidad formulada por Bayes, para tener una notación
coherente.

La respuesta es fácil, y sin mayor análisis mostramos la operación. En efecto, ahora


que tenemos diagramado el árbol y las probabilidades asociadas a cada rama en
el Diagrama 2. De modo que tenemos la probabilidad de sacar una bolita roja del
segundo evento cuando partimos por el carril de las negras, P(N/R) y también
tenemos la probabilidad total de Roja [1]. Por tanto,

Es decir, tomamos la probabilidad de sacar una bolita roja, cuando partimos por el
carril de las negras y lo dividimos por la probabilidad total de sacar una roja
calculada en [1] y ahí tenemos una aplicación concreta del Teorema de Bayes.

Formalizando el Experimento 1

Observamos que el Evento2 está condicionado por el Evento1, por eso son eventos
llamados mutuamente excluyentes (o independientes). Es decir, para que ocurra el
segundo evento debe ocurrir el primero. Otra propiedad de estos eventos, es que su
probabilidad siempre es diferente de cero.

- p(A B) = p(A) • p(B). Es la probabilidad del suceso consecutivo de A y B. Se


aplica el llamado "Principio de Dualidad".
Si se sigue una de los dos carriles del árbol, en la medida que avancemos por cada
rama iremos aplicando la multiplicación de las probabilidades que están asociada a
la conectiva (conjunción) del Algebra de Boole, o equivalentemente a la
intersección de la Teoría de Conjuntos. Se dice p(A B) = p(A) • p(B) si los sucesos
A y B son independientes.
- p(A B) = p(A) + p(B). Es la probabilidad que ocurra el procesa A o el procesos B.
(Ver axioma de la probabilidad, Regla de la Adición)
Si se bifurca por uno de los carriles, se aplica la suma de la probabilidades que
siguen por la rama, dado que se asocia la conectiva v (disyunción) del Algebra
Booleana, o equivalentemente la unión de la Teoría de conjuntos. Nótese que
siempre estamos aplicando esta regla a conjuntos disjuntos (A B = Φ).

Entonces, el proceso estocástico se dará sobre los buzones 1 y 2, los cuales están
cargados inicialmente con bolitas negras y rojas. Al poner en movimiento el
experimento, observamos que cada uno de los eventos que lo constituyen, son
sucesos probabilísticas y parte del espacio muestral (número total de posibilidades
del experimento).

Por tanto, la expresión con notación formal del calculo de la probabilidad en [1] es:

Pc(R) = P(N)·P(R/N)+P(R)·P(R/R)

Y la expresión con notación formal, calculada en [2] de acuerdo al Teorema de


Bayes es:

Es decir, PB(N/R) en el marco del Experimento1, responde la pregunta ¿Cuál es la


probabilidad de sacar una bolita roja del segundo buzón, dado que la primera
bolita fue negra?

II. Experimento Dado el Árbol y Cantidades

Experimento 2
Realicemos un experimento al revés, donde está dado un diagrama de árbol con
cinco fuentes de entregables, los cuales - en un segundo evento-, pueden ser
rechazados o aprobados. Los valores de cada carril y rama son absolutos y nos
preguntan:

¿Cuál es la probabilidad de que un entregable Aprobado provenga de D?.

Transcribamos el árbol en tablas para determinar sus distribuciones probabilísticas.


Al tener las cantidades de entregables A, B, C , D y E , con sus respectivas
distribuciones en el segundo evento de Rechazados o Aprobados, entonces podemos
asumir y asignar sus probabilidades. En efecto, la suma de los entregables es el
espacio muestral del primer evento, los cuales suman 200 entregables:

E1: Distribución Cantidades por Carriles de Entregables


A B C D E Total
40 25 30 55 50 200

E1: Distribución de Probabilidades por Carril de Entregables


P(A) P(B) P(C) P(D) P(E)
40/200 25/200 30/200 55/200 50/200
0.2 0.125 0.15 0.275 0.25

A continuación la distribución por ramas del segundo evento E2:


E2: Distribución de Rechazo o Aprobaciones por Carril
A B C D E
Rechazad Rechazad Rechazad Rechazad Rechazad
Aprobado Aprobado Aprobado Aprobado Aprobado
o o o o o
10 30 12 13 14 16 25 30 8 42
10/40 39/40 12/25 13/25 14/30 16/30 25/55 30/55 8/50 42/50
0.25 0.75 0.48 0.52 0.47 0.53 0.45 0.55 0.16 0.84
1 1 1 1 1

Por tanto la Probabilidad Total de ser un Entregable Aprobado es:

y la probabilidad de que un entregable Aprobado que proviene de D, la obtenemos


aplicando Bayes. Por tanto, siguiendo el carril E hasta Aprobado y diviendo ese valor
por la Probabilidad Total de Los Aprobados:

Formalmente con la notación que estamos usando, la expresión queda así:

III. Asociando Datos Estadísticos

A continuación ilustraremos como se asocia la frecuencia relativa, capturada como


dato, a la la probabilidad del evento. En efecto, el uso práctico en el transporte,
medicina, finanzas, usabilidad de determinadas navegaciones o rutinas de los
usuarios en un sistema, o en todas las actividades y disciplinas donde se recaban
datos en forma sistemática y bien clasificada, se utiliza como probabilidad la
proporción del espacio muestral que ocupa. Estas observaciones, pueden ir creciendo
en el tiempo. Es decir, la proporcionalidad de lo coeficientes y del tamaño del
espacio muestral son dinámicos.

En efecto, se asume que cuando las repeticiones son grandes y su número de


observaciones crece en forma indefinida, entonces la frecuencia relativa converge
hacia la probabilidad del evento, y se considera que las frecuencias relativas
tienden a estabilizarse. La noción de frecuencia o de "a posteriori" es entonces de
tipo empírico.

Es necesario comprender que cuando la escala en ordenes de magnitud aumenta,


seguramente variables discretas hay que intentar tratarlas como continuas e
incorporar la estadística y modelos estadísticos bayesianos computacionalmente.

Experimento 3

En un sector de la ciudad, se contabilizaron 220.000 pasajeros que viajan en un


período determinado, - entre las 12:00 y las 13:00 horas -, las cifras señalan que el
20% de esta población se transporta en la línea E1, un 35% se moviliza en la línea E2
y el restante en otras líneas (Llamemos E3).

Distribución - Evento1
E1 fr E2 fr E3 fr
77.000 35% 44.000 20% 99.000 45%

La estadística muestra además que el 25% que ocupa la línea E1 son hombres, el 15%
de los hombres la línea E2 y el 60% de las mujeres viaja en las otras líneas de
transporte.

Las distribuciones discretas de probabilidad se muestran, es las siguientes tablas a


continuación:

Distribución Género por Líneas


E1 E2 E3
H M H M H M
25% 75% 15% 85% 40% 60%

¿Cuál es la probabilidad que un hombre haya utilizado la línea de transporte E2?

Diagrama 5

Es claro que se definen tres carriles en el Diagrama 5 de árbol, E1, E2 y E3. Donde
cada uno de ellos cuenta con dos ramas binarias de género. Por tanto los eventos
son: Pasajeros que pueden utilizar una de las tres líneas y desde ahí, el evento que
el Pasajero pueda ser hombre.

La Probabilidad Total de ser Hombre se calcula como:

Pc(H) = P(E1) · P(H/E1) + P(E2) · P(H/E2) + P(E3)·P(H/E3)


Es decir, en términos numéricos:

Aplicando el Teorema de Bayes:

IV. Formalización Matemática del Teorema de Bayes

Sea E un evento de un espacio muestral S, y sean A1,A2,A3,...,An , eventos disjuntos,


cuya unión es S. (Ver concepto de Partición en Conjuntos)

Entonces para i = 1,2,3,....n, se tiene la siguiente fórmula:

Se considera que los eventos A = {A1,A2,A3,...,An} son causas posibles del evento E, de
ahí que el Teorema de Bayes nos permite estimar la probabilidad de que un
elemento particular de A ocurra siempre que el suceso E haya ocurrido.

Nótese que una sucesión de observaciones A1,A2,A3,...,An se denomina Proceso


Estocástico, cuando los valores de los Ai no son predecibles exactamente, pero si es
posible tener sus probabilidades y responden a una relación de orden (generalmente
en el tiempo).

V. Conclusión

La importancia que tiene para empresas como DocIRS, donde uno de sus focos es el
tratamiento documental de datos, análisis estadístico de contenidos, desarrollo y
gestión de plataformas tecnológicas, para el control y seguimiento de proyectos y
contratos, es entender que el Teorema de Bayes nos ayuda y nos induce a abrir
conocimiento permanentemente, mejorar los algoritmos y la gestión de calidad.

La experiencia directa y sorprendente en DocIRS e inimaginable para cualquier


pedagogo de la matemática, nos demuestra que un joven programador de
computadoras, puede ir haciendo y desarrollando complejos algoritmos, sin tener el
más mínimo conocimiento formal, ni teórico de la matemática. Tengo evidencias
fehacientes de programadores, que en varias ocasiones han construido complicadas
funciones en un lenguaje de alta programación-, respondiendo a un requerimiento
determinado de un sistema.

En efecto, al analizar los códigos de lo desarrollado, siempre encuentro relaciones


complejas y múltiples, recurrencia, condicionales anidados con lógica de Boole,
aplicación de series, espacios de probabilidades y clases de intervalos. Todas la
rutinas las han construido intuitivamente, sin saber siquiera que existen esos
conceptos, teoremas, propiedades y definiciones. Ni siquiera conocen su notación
matemática y menos Teoría de la Medida. El logro es sólo por su oficio con el
computador, en su lenguaje de programación y manejo que tienen sobre Internet.

Por esa razón, dada una exigencia en una de nuestras plataformas, desarrollé una
simple rutina a modo de ejemplo, donde apliqué el Teorema de Bayes, - sin
mencionar el teorema, ni nada por el estilo -, solo utilizando un diagrama de árbol
para la estimación de los resultados. La expliqué y traspasé al equipo de desarrollo
asignándoles una serie de tareas análogas, pero más complejas. La experiencia me
demostró una vez más, que es posible transmitir un conocimiento en forma
"mecánica" o por recetas de cocina, como dirían los académicos.

En efecto, una acertada aplicación del Teorema de Bayes nos fue señalando cómo
debemos ir adaptando nuestros procesos, en función de las probabilidades,
estimadas desde los datos almacenados en las bases de datos, requerimientos y
accesos de usuarios, incidentes, fallas, reclamos, funcionamiento de nuestro
networking, seguridad de la información, evolución del negocio del cliente,
elementos que se están generando permanentemente.

La estadística bayesiana de las transacciones en nuestras plataformas, las iniciamos


con un conjunto de supuestos, que nos han permitido ir ajustándolos y mejorándolos
en función de la evidencia empírica que recolectamos diariamente. Colección de
datos que permiten estar creando posibles escenarios, probando y analizando, a fin
de determinar resultados y su posible variabilidad, con eventos independientes, o
dependientes, variables aleatorias, distribuciones de probabilidad, regresión
lineales y proyecciones futuras.

También podría gustarte