Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CAPÍTULOVII
Introducción al cálculo de
probabilidad, tasas y riesgo
Ximena Aguirrezábal y Gustavo Saona
7.1. INTRODUCCIÓN
La probabilidad como una medida de la ocurrencia de una determinada observación es aplicable al
estudio de fenómenos sencillos y complejos. La teoría de probabilidad fue desarrollada en sus
comienzos para ser aplicada a los juegos de azar y posteriormente se extendió a las disciplinas
científicas, en particular la Medicina. Ejemplos de ello son: el estudio de la frecuencia con que se
presenta una determinada enfermedad en una población (prevalencia); ¿qué probabilidad tiene un
test diagnóstico de detectar individuos enfermos?; ¿cómo se incrementará el número de consultas
por enfermedades reumáticas en poblaciones más longevas?
En todo estudio de probabilidades los experimentos u observaciones deben proporcionar re-
sultados variables o distintos, dando origen a lo que se denomina experimento aleatorio. Para un
experimento aleatorio hay una serie de casos posibles que son llamados eventos o sucesos elemen-
tales. Asímismo, al conjunto de los sucesos elementales se les denomina espacio muestral (Ω) (ver
capítulo 4. En muchas situaciones es de interés un subconjunto de sucesos elementales en Ω, que
constituyen las categorías de eventos para el estudio, como en el caso de la clasificación en niño o
adulto, si se es menor de 15 años. Si exciten N sucesos elementales se establece una corresponden-
cia entre ellos y los eventos de Ω donde cada elemento puede ser clasificado como perteneciente o
no al evento. Luego el número total de eventos de Ω será 2N ya que depende del número total de
sucesos elementales y de la clasificación dicotómica de los mismos por su pertenencia al evento.
donde n(A) es el número de resultados elementales posibles que son favorables al evento A y
N(Ω) número total de resultados posibles, donde todos son igualmente probables y mutuamente
excluyentes.
donde n(A) es el número de veces que aparece el evento favorable A en el total de la muestra
(N(TM)), que pueden ser un número de observaciones o experimentos. En el mismo sentido pode-
mos decir que la probabilidad buscada P(A) se obtiene de la proporción o frecuencia relativa (FR) en
que aparece el evento favorable en el total de observaciones realizadas. Véase que dentro de este
enfoque no es necesario suponer que los eventos son igualmente probables ya que la frecuencia de
los mismos se determina por su observación en el conjunto de los sucesos que integran la muestra.
Tabla 7.2.1.
Sólo la localidad C supera los valores históricos pasando a ser un probable foco
epidémico.
dad de sucesos únicos. Ejemplo de esto puede ser un estudio en el que se le consulta a expertos
sobre la posibilidad de hallar una cura para el SIDA en los próximos 20 años y se asume que la
probabilidad es igual al valor, entre 0 y 1, que ellos asignen por su confianza en la ocurrencia del
suceso. Esta perspectiva no es muy aceptada entre los estadísticos más tradicionales y presenta
serias dificultades en el momento de contrastar sus resultados.
Los axiomas precedentes indican que la probabilidad es un valor no negativo (i) acotado entre
cero y uno (i, ii). Donde cero implica que el suceso es improbable (no ocurre nunca) y uno significa
que el mismo se verifica siempre. Si pensamos en un suceso cuya probabilidad es cero, podemos
imaginarnos que esperamos el movimiento de un objeto sobre el que estamos seguros que no
actúa ninguna fuerza, P(movimiento)= 0. Por el contrario si sobre un objeto actúa alguna fuerza
que no es compensada por otra, podemos asegurar en base a las leyes de la Física que el mismo se
moverá, P(movimiento)= 1.
En algunas ocasiones es posible encontrarse con probabilidades expresadas como porcentajes
(por ejemplo: la probabilidad de tener un hijo varón es del 50%). Esta expresión no debe ser
motivo de confusión ya que lo único que ha cambiado es la escala al multiplicar por cien los valores
de probabilidad (0% ≤ P(A) ≤ 100%).
Según indica el segundo axioma (ii) la suma de las probabilidades de ocurrencia de todos los
elementos del espacio muestral (Ω) es igual a uno. Pensemos en la maternidad de un Hospital en la
que durante un día se han dado los siguientes tipos de partos: cesárea (P= 5/23= 0,22), con
fórceps (P= 3/23= 0,13) y natural (P= 15/23= 0,65). Podemos verificar de forma sencilla que la
probabilidad del suceso parto es igual a P(Ω)= 0,22 + 0,13 + 0,65= 1.
Una propiedad que se deduce del segundo axioma (ii) es que la probabilidad del conjunto vacío
es cero (P(∅) = 0). En forma intuitiva debemos pensar que en un conjunto sin elementos es
improbable observar algún suceso y por tanto la probabilidad que se busque siempre será cero.
Para poder entender las implicancias del tercer axioma (iii) es necesario refrescar algunos con-
ceptos relacionados con los operadores utilizados en la Teoría de Conjuntos desarrollada por
George Cantor (siglo XIX). La unión de conjuntos (∪ ∪) es el resultado de la suma de los elemen-
tos de los conjuntos considerados. Por ejemplo sea A= {a1, a2, a3} y B= {b1, b2}, el nuevo conjunto
resultante de la unión es la suma de los elementos de ambos conjuntos A∪B= {a1, a2, a3, b1, b2}.
Además, otro de los operadores importantes es la intersección de conjuntos (∩ ∩) que consiste
en los elementos comunes de los conjuntos considerados. Por ejemplo sea C= {c1, c2, c3, e1, e2} y
D= {d1, d2, e1, e2}, el conjunto intersección es A∩B= {e1, e2}. Ahora volviendo al tercer axioma
podemos ver que la unión de las probabilidades de dos conjuntos P(A∪B), queda definida por la
suma de las probabilidades de los conjuntos individuales P(A) y P(B). Este axioma se cumple si no
hay elementos comunes entre los conjuntos, o sea no hay intersección. En forma más general
podemos escribir:
¢ £
n
n
P ∪ Ai = P ¢Ai £ donde A1,A2,A3,...,An son disjuntos
=
k 1 k 1=
Estadística médica | Línea de métodos cuantitativos | !'
Figura 7.4.1. La figura muestra un Diagrama de Venn representando al subconjunto A y a su complemento AC.
Además se puede ver que la probabilidad de la unión de ambos subconjuntos es igual a la suma de las
probabilidades de los mismos e igual a 1 por constituir todo Ω.
Figura 7.4.2. La figura muestra dos Diagramas de Venn que describen la característica de un conjunto excluyente
y no excluyente. En el primero de los casos (izquierda) la probabilidad de la intersección es igual a cero ya que no
hay elementos comunes entre los subconjuntos (A y B) y en el segundo (derecha) la probabilidad de la
intersección no es cero (existe A∩B).
Figura 7.4.3. El diagrama de Venn muestra los conjuntos de pacientes con patologías respiratorias (A= 12), con
afecciones cardíacas (B= 9) y la intercesión de los que presentan ambas enfermedades (AB= 3). Los pacientes
indicados con ? son aquellos que consultaron por otros motivos.
P(A∪B)=P(A)+P(B)P(A ∩ B)=(12/50)+(9/50)(3/50)=18/50=0,36
Figura 7.4.4. La figura muestra tres relaciones distintas entre los subconjuntos del espacio muestral Ω y el
correspondiente cálculo de las probabilidades condicionadas. Sólo en el caso del diagrama central puede darse
que P(A/B)= P(A) y P(B/A)= P(B) si los sucesos son independientes.
¢ £
n
n
P ∩ Ai = P ¢Ai £
=
k 1 =
k 1
Tabla 7.4.1.
P(SD/M)= P(SD∩M)/P(M)=0,006
Por los resultados obtenidos podríamos suponer que los sucesos en estudio no
son independientes siendo mayor la probabilidad del Síndrome Demencial en el
sexo femenino (P(SD / Hombre)= 0,002). La confirmación de la hipótesis
previa requiere de un análisis estadístico que será visto en el Capítulo 12.
Tabla 7.4.2.
Por los resultados obtenidos podemos concluir que los sucesos en estudio son
independientes siendo también la probabilidad de presentar Temblor Esencial en
el sexo femenino igual a 0,002 (P(TE / Mujer)).
Figura 7.4.5. La figura muestra el polígono de densidad (izquierda9, construido con frecuencias relativas, y la ojiva
(derecha) de los datos de Índice de Masa Corporal (IMC) de la población escolar de 9 a 12 años de un barrio de
Montevideo
0,15
0,1237
0,1175
0,1184
0,1028
Frecuencia Relativa
0,10 0,1013
0,0812 0,0794
0,0582
0,0565
0,05
0,0379
0,0364
0,0226 0,0214
0,0059 0,0120 0,0118
0,0055 0,000
0,0010 0,0024 0,001
0,0026 0
0,00
9,5 11,5 13,5 15,5 17,5 19,5 21,5 23,5 25,5 27,5 29,5
IMC (KG/m 2)
Estadística médica | Línea de métodos cuantitativos | "!
P ¢ A1 £D P ¢B / A1£
P ¢ A1 / B£ =
P ¢ A1 £ DP ¢B / A1£ A P ¢ A 2£ DP ¢B / A2£
P ¢ A1 £D P ¢B / A1£
P ¢ A1 / B£ =
P ¢ A1 £D P ¢B / A1£ AP ¢ A2 £D P ¢B / A2 £
¿Qué nos dice este resultado? Si una persona se selecciona en forma aleatoria
de la población la probabilidad de presentar tuberculosis es de 0,20. Si a dicha
persona se le aplica la prueba y resulta positiva, la probabilidad de que en
realidad presente dicha enfermedad aumenta aproximadamente 3 veces de 0,20 a
0,60.
Si bien el problema anterior está formado sólo por dos eventos, A1 y A2, en otros casos pueden
existir más de dos probabilidades. En estos casos el denominador del teorema de Bayes necesita
términos adicionales.
P ¢ A1£ DP ¢ B / A1£
P ¢ A1 / B£ =
P ¢ A1 £D P ¢B / A1£ AP ¢ A2 £D P ¢B / A2 £A .. A P ¢An £D P ¢B / An £
donde A1, A2,...., An son todos eventos mutuamente excluyentes. En una forma reducida pode-
mos reescribir la ecuación de la siguiente manera:
¢ £ ¢
P A1 D P B / A 1 £
¢
P A1 / B =£ n
i =1,2,...,n
¢P ¢Ai £DP ¢B / Ai ££
i =1
prerrenal P(S/A)= 0,75; una patología renal P(S/B)= 0,62; una patología
postrenal P(S/C)= 0,005. Además se cuenta con estudios que determinan una
prevalencia para las distintas causas de oligoanuria: P(A)= 0,009; P(B)= 0,03;
P(C)= 0,005.
¿Cuál es la probabilidad para las tres causas de oligoanuria (prerrenal, renal y
postrenal) frente al resultado del análisis de orina?
Solución. Suponiendo que los eventos A, B y C son mutuamente excluyentes
podemos por medio del teorema de Bayes obtener las probabilidades
consultadas: P(A/S), P(B/S) y P(C/S).
P ¢ A£ DP ¢S / A£
P ¢ A / S£ = =
P ¢ A£ DP ¢S / A£ AP ¢B £ DP ¢S / B£ AP ¢C £D P ¢S / C £
0,00 D 0,75
= 0,006 / 0,02 = 0,27
0,00 D 0,75A 0,03 D 0,62 A 0,00 D 0,00
P ¢B £ DP ¢S / B£
P ¢B / S£ = =
P ¢ A£ DP ¢S / A£ AP ¢B £ DP ¢S / B£ AP ¢C £D P ¢S / C £
¢ 0,03D0,62£ / 0,02 =0,73
P ¢ C£ DP ¢S / C £
P ¢C / S£ = =
P ¢ A£ DP ¢S / A£ AP ¢B £D P ¢S / B £ AP ¢C £D P ¢S / C £
¢ 0,00 D0,00 £ / 0,02 =0,001
¢£
n
e i
i =1
Tasa = n
Dk i =1,2,...,n
ti
i =1
donde ei es la suma de los individuos enfermos o muertos en un periodo determinado, ti es la
sumatoria de los tiempos en que los individuos de la población en riesgo están libres del evento
(persona-tiempo de exposición) y k es una constante (eje: 10, 100, 1.000, 10.000) denominada