Está en la página 1de 11

Estadística médica | Línea de métodos cuantitativos | !

CAPÍTULOVII

Introducción al cálculo de
probabilidad, tasas y riesgo
Ximena Aguirrezábal y Gustavo Saona

7.1. INTRODUCCIÓN
La probabilidad como una medida de la ocurrencia de una determinada observación es aplicable al
estudio de fenómenos sencillos y complejos. La teoría de probabilidad fue desarrollada en sus
comienzos para ser aplicada a los juegos de azar y posteriormente se extendió a las disciplinas
científicas, en particular la Medicina. Ejemplos de ello son: el estudio de la frecuencia con que se
presenta una determinada enfermedad en una población (prevalencia); ¿qué probabilidad tiene un
test diagnóstico de detectar individuos enfermos?; ¿cómo se incrementará el número de consultas
por enfermedades reumáticas en poblaciones más longevas?
En todo estudio de probabilidades los experimentos u observaciones deben proporcionar re-
sultados variables o distintos, dando origen a lo que se denomina experimento aleatorio. Para un
experimento aleatorio hay una serie de casos posibles que son llamados eventos o sucesos elemen-
tales. Asímismo, al conjunto de los sucesos elementales se les denomina espacio muestral (Ω) (ver
capítulo 4. En muchas situaciones es de interés un subconjunto de sucesos elementales en Ω, que
constituyen las categorías de eventos para el estudio, como en el caso de la clasificación en niño o
adulto, si se es menor de 15 años. Si exciten N sucesos elementales se establece una corresponden-
cia entre ellos y los eventos de Ω donde cada elemento puede ser clasificado como perteneciente o
no al evento. Luego el número total de eventos de Ω será 2N ya que depende del número total de
sucesos elementales y de la clasificación dicotómica de los mismos por su pertenencia al evento.

7.2. PERSPECTIVA OBJETIVA Y SUBJETIVA DE LA PROBABILIDAD


En sus comienzos la teoría de probabilidad sólo contó con la visión objetiva del Enfoque Clásico
iniciado por Blaise Pascal y Pierre de Fermat (vía correspondencia de 1654) y posteriormente
desarrollado por Pierre S. Laplace (1812). El enfoque clásico o también llamado «a priori», porque
permite el cálculo de probabilidades previo a la ocurrencia del evento, se basa en el conocimiento
de las características del espacio muestral (Ω). Este espacio muestral es generalmente un conjunto
finito y numerable de eventos (por ejemplo: caras de un dado, un mazo de naipes, Hospitales de
Uruguay). Si queremos conocer la probabilidad del evento A según este enfoque debemos calcular
el siguiente cociente:
n ¢A £
P ¢A £ =
N ¢Ð £
!$ | Estadística médica | Línea de métodos cuantitativos

donde n(A) es el número de resultados elementales posibles que son favorables al evento A y
N(Ω) número total de resultados posibles, donde todos son igualmente probables y mutuamente
excluyentes.

Ejemplo 7.1. ¿Qué probabilidad tiene un sujeto de obtener un 3 en una tirada


de un dado?
Solución: Ya que n(3)= 1 y Ω= 1, 2, 3, 4, 5, 6.
n ¢3 £ 1
P ¢3 £= = = 0,166
N ¢ У 6

Ejemplo 7.2. Una Institución Mutual necesita conocer al menos


aproximadamente el número de diabéticos nuevos (nDN) para el siguiente mes,
con motivo de adquirir los medicamentos necesarios. Se sabe que en la
actualidad el número de asociados no diabéticos es 14.234 (N(Ω)) y se conoce la
incidencia de la enfermedad en el ultimo año esa institución que es 0,006 casos
nuevos por año.
Solución. La incidencia que se conoce en este caso es la probabilidad de
enfermar de diabetes (P(DN)) en esta población (ver sección 7.6), pero el valor
0,006 corresponde a lo determinado para 12 meses. Si suponemos que la
incidencia no varia en forma importante a lo largo del año, podemos calcularla
para un mes 0,006/12= 0,0005. Ahora despejando de:
n ¢DN £
P ¢DN £= 1 n ¢DN £ =N¢Ð£ DP ¢DN £=14,234D0,0005 =7,117 approx=7
N¢ У

Dentro de la perspectiva objetiva también existe el Enfoque de Frecuencias Relativas o «a


posteriori» iniciado por J. Venn (1888) y R. von Mises (1919). Esta otra forma de obtención de los
valores de probabilidad nos permite ampliar enormemente el espectro de aplicación de la teoría.
En este sentido podemos extenderla al caso de conjuntos infinitos numerables o no numerables.
Para el cálculo de las probabilidades de un determinado evento a través de este enfoque es necesa-
rio contar con datos empíricos, producto del desarrollo de un experimento o encuesta por ejem-
plo. La probabilidad se obtiene como:
n ¢A £
P ¢A £ =FR¢ A £ =
N¢ TM £

donde n(A) es el número de veces que aparece el evento favorable A en el total de la muestra
(N(TM)), que pueden ser un número de observaciones o experimentos. En el mismo sentido pode-
mos decir que la probabilidad buscada P(A) se obtiene de la proporción o frecuencia relativa (FR) en
que aparece el evento favorable en el total de observaciones realizadas. Véase que dentro de este
enfoque no es necesario suponer que los eventos son igualmente probables ya que la frecuencia de
los mismos se determina por su observación en el conjunto de los sucesos que integran la muestra.

Ejemplo 7.2.3. Se realizó un estudio de prevalencia (probabilidad de estar


enfermo) de diabetes en la población internada de dos instituciones pública y
privada denominado «Prevalencia de diabetes en pacientes internados» (Serra et
Estadística médica | Línea de métodos cuantitativos | !%

al, 2002). En el mismo se encontró para el hospital público una población


internada de 194 en la cual 37 pacientes eran diabéticos, mientras que en la
institución privada (IP) de 151 internados 21 presentaba diabetes. La frecuencia
absoluta por sexo para el hospital fue de 117 hombres en la población general y
28 en la subpoblación diabética. En cambio en la institución privada 80 fueron
del sexo masculino en la población general y 14 en la subpoblación diabética.
¿Cuál es la probabilidad (FR y %) de ser diabético en la población internada de
estas dos instituciones? ¿Cuál es la probabilidad del sexo masculino (H) en la
población general y en la subpoblación diabética?
Solución. La Tabla 7.2.1 presenta las prevalencia de diabetes (probabilidad en
FR y %) para la población general (fila 1) y la proporción del sexo masculino en
la población general (fila 2) y en la población diabética (fila 3).

Tabla 7.2.1.

Hospital (FR) Hospital (%) IP (FR) IP (%)


(1) Pob. General 37/194= 0,19 19 21/151= 0,14 14
(2) Pob. General H 117/194= 0,60 60 80/151= 0,53 53
(3) Pob. Diabética H 28/37= 0,76 76 14/21= 0,67 67

Podemos ver que la probabilidad de ser diabético es levemente superior en el


Hospital si se compara con la institución privada (fila 1). Además, se puede
observar que la proporción de hombres en la subpoblación diabética es mayor
en cada institución que la misma en la población general (filas 2 y 3), sugiriendo
que el sexo masculino podría ser más afectado por esta enfermedad o que los
hombres diabéticos se internan más.

Ejemplo 7.2.4. El Ministerio de Salud Publica mantiene un permanente


monitoreo de la Hepatitis en base a la denuncia obligatoria de los casos por parte
del medico tratante, en cada uno de sus servicios. Se han ubicado tres focos para
la enfermedad con los siguientes números de infectados en el último mes:
localidad A= 3, localidad B= 4 y localidad C= 2. Estas localidades presentan
15.023, 8.234 y 1.423 habitantes respectivamente. Los registros históricos señalan
una prevalencia (probabilidad) para la hepatitis en la región estudiada de 0,0007
casos por año ¿Cuál de los focos debe ser tenido en cuenta para una probable
epidemia en relación a los valores históricos?
Solución. Contamos con los valores de frecuencia absoluta de los enfermos de
cada localidad y para obtener su frecuencia relativa (probabilidad) debemos
calcular los cocientes:
P(A)= 3 / 15.023= 0,0002 P(B)= 4 / 8.234= 0,0005 P(C)= 2 / 1.423= 0,0014

Sólo la localidad C supera los valores históricos pasando a ser un probable foco
epidémico.

Más recientemente se comenzó a desarrollar el concepto de probabilidad subjetiva, en especial


debido a L. J. Savage (1950). Esta perspectiva asume que la probabilidad puede ser una medida de
la confianza que un individuo tiene de la certeza de determinada proposición. Este enfoque cuenta
con la ventaja de no depender de la repetitividad de ningún evento y permite calcular la probabili-
!& | Estadística médica | Línea de métodos cuantitativos

dad de sucesos únicos. Ejemplo de esto puede ser un estudio en el que se le consulta a expertos
sobre la posibilidad de hallar una cura para el SIDA en los próximos 20 años y se asume que la
probabilidad es igual al valor, entre 0 y 1, que ellos asignen por su confianza en la ocurrencia del
suceso. Esta perspectiva no es muy aceptada entre los estadísticos más tradicionales y presenta
serias dificultades en el momento de contrastar sus resultados.

7.3. DEFINICIÓN AXIOMÁTICA DE LA PROBABILIDAD (A. N. KOLMOGOROV, 1933)


i. P(A) ≥ 0.
ii. P(Ω) = P(A1) + P(A2) + P(A3) +............+ P(An) = 1.
iii. P(A∪B)= P(A) + P(B) siempre que A y B sean conjuntos disjuntos.

Los axiomas precedentes indican que la probabilidad es un valor no negativo (i) acotado entre
cero y uno (i, ii). Donde cero implica que el suceso es improbable (no ocurre nunca) y uno significa
que el mismo se verifica siempre. Si pensamos en un suceso cuya probabilidad es cero, podemos
imaginarnos que esperamos el movimiento de un objeto sobre el que estamos seguros que no
actúa ninguna fuerza, P(movimiento)= 0. Por el contrario si sobre un objeto actúa alguna fuerza
que no es compensada por otra, podemos asegurar en base a las leyes de la Física que el mismo se
moverá, P(movimiento)= 1.
En algunas ocasiones es posible encontrarse con probabilidades expresadas como porcentajes
(por ejemplo: la probabilidad de tener un hijo varón es del 50%). Esta expresión no debe ser
motivo de confusión ya que lo único que ha cambiado es la escala al multiplicar por cien los valores
de probabilidad (0% ≤ P(A) ≤ 100%).
Según indica el segundo axioma (ii) la suma de las probabilidades de ocurrencia de todos los
elementos del espacio muestral (Ω) es igual a uno. Pensemos en la maternidad de un Hospital en la
que durante un día se han dado los siguientes tipos de partos: cesárea (P= 5/23= 0,22), con
fórceps (P= 3/23= 0,13) y natural (P= 15/23= 0,65). Podemos verificar de forma sencilla que la
probabilidad del suceso parto es igual a P(Ω)= 0,22 + 0,13 + 0,65= 1.
Una propiedad que se deduce del segundo axioma (ii) es que la probabilidad del conjunto vacío
es cero (P(∅) = 0). En forma intuitiva debemos pensar que en un conjunto sin elementos es
improbable observar algún suceso y por tanto la probabilidad que se busque siempre será cero.
Para poder entender las implicancias del tercer axioma (iii) es necesario refrescar algunos con-
ceptos relacionados con los operadores utilizados en la Teoría de Conjuntos desarrollada por
George Cantor (siglo XIX). La unión de conjuntos (∪ ∪) es el resultado de la suma de los elemen-
tos de los conjuntos considerados. Por ejemplo sea A= {a1, a2, a3} y B= {b1, b2}, el nuevo conjunto
resultante de la unión es la suma de los elementos de ambos conjuntos A∪B= {a1, a2, a3, b1, b2}.
Además, otro de los operadores importantes es la intersección de conjuntos (∩ ∩) que consiste
en los elementos comunes de los conjuntos considerados. Por ejemplo sea C= {c1, c2, c3, e1, e2} y
D= {d1, d2, e1, e2}, el conjunto intersección es A∩B= {e1, e2}. Ahora volviendo al tercer axioma
podemos ver que la unión de las probabilidades de dos conjuntos P(A∪B), queda definida por la
suma de las probabilidades de los conjuntos individuales P(A) y P(B). Este axioma se cumple si no
hay elementos comunes entre los conjuntos, o sea no hay intersección. En forma más general
podemos escribir:

¢ £
n
n
P ∪ Ai =Œ P ¢Ai £ donde A1,A2,A3,...,An son disjuntos
=
k 1 k 1=
Estadística médica | Línea de métodos cuantitativos | !'

7.4. CÁLCULO DE PROBABILIDAD Y SUS PROPIEDADES


De los axiomas precedentes y la Teoría de Conjuntos se deducen las siguientes propiedades:
• Complemento: un conjunto A perteneciente a Ω tiene por complementario al conjunto AC si
este contiene a todos los elementos de Ω que no están incluidos en A (figura 7.4.1). La letra «c»
como supraíndice indica que el conjunto al que se hace referencia es el complemento de otro. Ya
que la unión de los conjuntos A y AC mencionados anteriormente es igual a Ω la suma de las
probabilidades de los mismos debe ser igual a 1 según el segundo axioma (ii).

Figura 7.4.1. La figura muestra un Diagrama de Venn representando al subconjunto A y a su complemento AC.
Además se puede ver que la probabilidad de la unión de ambos subconjuntos es igual a la suma de las
probabilidades de los mismos e igual a 1 por constituir todo Ω.

Ejemplo 7.4.1. En la maternidad de un Hospital nacieron 499 varones de un


total de 1.324 nacimientos vivos en el último año. ¿Qué probabilidad presentó el
nacimiento de niños del sexo masculino (M) y femenino (F) en este hospital
durante el pasado año?
Solución: P(M)= 499/1.324= 0,377 y por complemento
P(F)= 1-P(M)=1-0,377= 0,623

• Sucesos excluyentes y no excluyentes: cuando se estudia la ocurrencia de un suceso en el


conjunto Ω, donde se distinguen subconjuntos de eventos (A y B), puede presentarse una de las
siguientes situaciones: los subconjuntos A y B no presentan elementos comunes los subconjuntos
sí presentan elementos en común. En el primero de los casos hablamos de conjunto de sucesos
mutuamente excluyentes y en el segundo de no excluyentes (figura 7.4.2).

Figura 7.4.2. La figura muestra dos Diagramas de Venn que describen la característica de un conjunto excluyente
y no excluyente. En el primero de los casos (izquierda) la probabilidad de la intersección es igual a cero ya que no
hay elementos comunes entre los subconjuntos (A y B) y en el segundo (derecha) la probabilidad de la
intersección no es cero (existe A∩B).

La ecuación expresada en la figura 7.4.2 es conocida como la regla de la suma de probabili-


dades. Podemos ver que si los conjuntos son excluyentes la intersección (A∩B) no tendrá
ningún elemento y por ello la probabilidad de la unión será igual a la suma de los elementos de
A y B dividido por el tamaño de Ω. En el caso que los conjuntos no sean excluyentes la intersec-
ción (A∩B) no será un conjunto vacío (∅) y por ello debemos restar una vez estos elementos ya
que en la suma serán considerados dos veces por pertenecer tanto al conjunto A como a B.

Ejemplo 7.4.2. En un determinado país las principales causas de muerte


registradas en los certificados de defunción son las enfermedades coronarias
P(m.c)= 0,21 y las infectocontagiosas P(m.i)= 0,16. ¿Qué probabilidad tiene una
persona de morir en este país de una enfermedad diferente a las anteriormente
mencionadas?
Solución. Las causas de muerte registradas son un típico caso de evento
mutuamente excluyente cuando se ha realizado una buena determinación de las
patologías que aquejaban al paciente. El médico debe completar el certificado de
defunción con una única causa de muerte. Por lo tanto podemos inferir que:
P(m.c.)+P(m.i.)+P(m. otras)= 1.
" | Estadística médica | Línea de métodos cuantitativos

Despejando podemos calcular: P(m. otras)=1-[P(m.c.)+P(m.i.)]=1-(0,21 + 0,16)= 0,63

Ejemplo 7.4.3. Durante una semana un médico atiende a 50 pacientes de ellos


12 presentaron patologías respiratorias (A), 9 pacientes con afecciones cardíacas
(B) y 3 pacientes presentaron ambas enfermedades (figura 7.4.3) ¿Cuál es la
probabilidad de haber atendido un paciente con afección respiratoria sin
patología cardíaca? ¿Qué probabilidad hay de atender pacientes presentando
afección respiratoria o cardíaca?

Figura 7.4.3. El diagrama de Venn muestra los conjuntos de pacientes con patologías respiratorias (A= 12), con
afecciones cardíacas (B= 9) y la intercesión de los que presentan ambas enfermedades (AB= 3). Los pacientes
indicados con ? son aquellos que consultaron por otros motivos.

Solución. La probabilidad de presentar únicamente una afección respiratoria (A)


es:
P(A)= Nº A / Nº Total= 9 / 50= 0,18

La probabilidad de atender pacientes presentando afección respiratoria o


cardíaca es:

P(A∪B)=P(A)+P(B)–P(A ∩ B)=(12/50)+(9/50)–(3/50)=18/50=0,36

• Probabilidad Condicional: Es la probabilidad de obtener A dado que (o tal que, /) se obtuvo


B, donde A y B son subconjuntos de Ω.
P ¢ A OB £
P ¢ A / B£ =
P ¢B £

En muchas ocasiones lo interesante es conocer la probabilidad de un evento A que puede estar


ligado a otro B, siendo ambos subconjuntos del espacio muestral (Ω) (figura 7.4.4). Es relevante
para el médico este análisis de las probabilidades ya que en muchas situaciones se quiere relacionar
la aparición de determinados síntomas con la presencia de alguna enfermedad. Es en el entorno
del cálculo de probabilidades condicionadas y en la búsqueda de relaciones entre eventos distintos
que surge el concepto de independencia entre conjuntos de sucesos. Dos conjuntos serán inde-
pendientes si la probabilidad de cualquiera de ellos no cambia con la ocurrencia del otro como lo
expresa la siguiente igualdad:
P(A/B)=P(A) ó P(B/A)=P(B)

Figura 7.4.4. La figura muestra tres relaciones distintas entre los subconjuntos del espacio muestral Ω y el
correspondiente cálculo de las probabilidades condicionadas. Sólo en el caso del diagrama central puede darse
que P(A/B)= P(A) y P(B/A)= P(B) si los sucesos son independientes.

Cuando lo que se busca es la probabilidad de dos o más eventos simultáneos recurrimos a la


regla de la multiplicación, que presenta variantes según sean los sucesos independientes o no.
En el caso de sucesos independientes dicha regla es expresada por la siguiente igualdad:
P(A ( B)= P(B ( A)= P(A) ( P(B)
y para n eventos independientes podemos generalizar de la siguiente manera:
Estadística médica | Línea de métodos cuantitativos | "

¢ £
n
n
P ∩ Ai =‹ P ¢Ai £
=
k 1 =
k 1

Sin embargo, si los sucesos no son independientes la regla de la multiplicación se expresa de la


forma siguiente:
P(A∩B)=P(B∩A)= P(A/B) x P(B)= P(B/A) x P(A)

Ejemplo 7.4.4. Se realizó un estudio transversal denominado «Estudio de la


prevalencia de las principales enfermedades neurológicas en una población del
Uruguay» (Ketzoian et al, 1997). En el mismo se determinó la frecuencia del
Síndrome Demencial y su relación con el sexo. La Tabla 7.4.1 muestra las
frecuencias absolutas de los resultados obtenidos.

Tabla 7.4.1.

Hombres Mujeres Total


Síndrome Demencial 16 70 86
Sanos 9.946 11.300 21.246
Total 9.962 11.370 21.332

¿Cuál es la probabilidad de presentar un Síndrome Demencial (SD) siendo mujer


(M)? ¿El SD y el sexo son sucesos independientes?

Solución. La probabilidad de la intercesión entre SD y sexo femenino es 0,003


(P(SD∩M)= 70/21.332) y la probabilidad del sexo femenino es 0,53 (P(M)=
11.370/21.332). Empleando la ecuación de la probabilidad condicionada
tenemos que:

P(SD/M)= P(SD∩M)/P(M)=0,006

Si el SD es independiente del sexo debería cumplir con la propiedad P(SD /


M)= P(SD).

P(SD)= 86/21.332= 0,004

Por los resultados obtenidos podríamos suponer que los sucesos en estudio no
son independientes siendo mayor la probabilidad del Síndrome Demencial en el
sexo femenino (P(SD / Hombre)= 0,002). La confirmación de la hipótesis
previa requiere de un análisis estadístico que será visto en el Capítulo 12.

Ejemplo 7.4.5. De la investigación «Estudio de la prevalencia de las principales


enfermedades neurológicas en una población del Uruguay» (Ketzoian et al,
1997), se extrae los siguientes datos:

Tabla 7.4.2.

Hombres Mujeres Total


Temblor Esencial 24 26 50
Sanos 9.938 11.344 21.282
Total 9.962 11.370 21.332
" | Estadística médica | Línea de métodos cuantitativos

¿Cuál es la probabilidad de presentar Temblor Esencial (TE) siendo hombre


(H)? ¿El TE y el sexo son sucesos independientes?

Solución. La probabilidad de la intercesión entre TE y sexo masculino es 0,001


(P(TE ∩ H)= 24/21.332) y la probabilidad del sexo masculino es 0,47 (P(H)=
9.962/21.332). Empleando la ecuación de la probabilidad condicionada
obtenemos:
P(TE/H)= P(TE ∩ H) / P(H)= 0,002

Si el TE es independiente del sexo debería cumplir con la propiedad P(TE/H)=


P(TE).

P(TE)= 50/21.332= 0,002

Por los resultados obtenidos podemos concluir que los sucesos en estudio son
independientes siendo también la probabilidad de presentar Temblor Esencial en
el sexo femenino igual a 0,002 (P(TE / Mujer)).

Ejemplo 7.4.6. Los estudios de obesidad y sobrepeso en poblaciones humanas


generalmente se basan en la toma de algunas medidas morfológicas que luego
permiten el cálculo de índices y el contraste con tablas de percentiles (ver
Sección 5.2.5). El Indice de Masa Corporal (IMC= peso Kg / talla2 m2) es uno
de los índices más utilizados y según la «International Obesity Task Force» en
poblaciones infantiles los individuos deben clasificarse en normopeso si su IMC
≤ 25, sobrepeso si su 25 < IMC <30, obesidad grado 1 si su 30 ≤ IMC <35,
obesidad grado 2 si su 35 ≤ IMC <40 y obesidad grado 3 si su IMC ≥ 40. La
Figura 7.4.5 presenta el polígono de densidad y la ojiva de los datos de IMC de
la población escolar (9 a 12 años) de un barrio de Montevideo.

Figura 7.4.5. La figura muestra el polígono de densidad (izquierda9, construido con frecuencias relativas, y la ojiva
(derecha) de los datos de Índice de Masa Corporal (IMC) de la población escolar de 9 a 12 años de un barrio de
Montevideo

0,15

0,1237

0,1175
0,1184
0,1028
Frecuencia Relativa

0,10 0,1013

0,0812 0,0794

0,0582
0,0565
0,05

0,0379
0,0364
0,0226 0,0214
0,0059 0,0120 0,0118
0,0055 0,000
0,0010 0,0024 0,001
0,0026 0
0,00
9,5 11,5 13,5 15,5 17,5 19,5 21,5 23,5 25,5 27,5 29,5

IMC (KG/m 2)
Estadística médica | Línea de métodos cuantitativos | "!

a) ¿Qué probabilidad presentan estos niños de padecer obesidad o sobrepeso?


b) ¿Cuál es la prevalencia del sobrepeso?
c) ¿Cuál es la probabilidad de padecer sobrepeso si su IMC es mayor de 20 Kg/
m 2?

Solución. Se presentan en cada caso una serie de formas equivalentes para el


cálculo de las probabilidades. Debemos recordar del Capítulo 5 que el área bajo
la curva (frecuencia) del polígono de densidad es igual a 1 y que la frecuencia
relativa acumulada en una ojiva también es igual a 1. A su vez, por el enfoque a
posteriori podemos considerar a la frecuencia relativa como indicador de la
probabilidad del evento considerado. Se presentan los resultados extraídos del
polígono y de la ojiva.
a) Polígono: P(obesidad o sobrepeso)= P(IMC > 25)= P(25 < IMC < 26) +
........+ P(30 < IMC < 31)= 0,0118 + 0,0055 + 0,0024 + 0,001 + 0,0004 +
0,0001= 0,0212
Ojiva: P(obesidad o sobrepeso)= P(IMC > 25)= 1 - P(IMC < 25)= 1 -
0,9788= 0,0212
b) Polígono: P(sobrepeso)= P(25 < IMC <30)= P(25 < IMC < 26) + ........+
P(29 < IMC < 30)= 0,0118 + 0,0055 + 0,0024 + 0,001 + 0,0004= 0,0211
Ojiva: P(sobrepeso)= P(25 < IMC <30)= P(IMC < 30) - P(IMC < 25)= 1-
(P(IMC < 25) + P(30 < IMC < 31))= 0,9999 - 0,9788= 1 - (0,9788 +
0,0001)= 0,0211
c) Polígono: P(sobrepeso / IMC > 20)= P(25 < IMC <30 / IMC > 20)= P(25
< IMC <30) / P(IMC >20)= 0,0211 / (P(20 < IMC < 21) + .....+P(30 <
IMC <31))= 0,0211 / 0,3162= 0,0667
Ojiva: P(sobrepeso / IMC > 20)= P(25 < IMC <30 / IMC > 20)= P(25 <
IMC <30) / P(IMC >20)= 0,0211/ (1 - P(IMC < 20))= 0,0211 / 0,3162=
0,0667

7.5. TEOREMA DE BAYES


Este teorema debe su nombre al reverendo Thomas Bayes (1702-1761), ministro presbiteriano
inglés, quien cuestionó la existencia de Dios. Tratando de responder su incertidumbre fue que
desarrolló una fórmula para llegar a evaluar la probabilidad de que Dios exista, usando como base
la evidencia reunida en la Tierra. Pero fue Pierre S. Laplace quien retomó el trabajo de Bayes y en
1781 lo publicó con el nombre de «Teorema de Bayes».
Como una extensión del cálculo de probabilidades condicionadas el teorema de Bayes permite
conocer la probabilidad del evento A1 dado que ha ocurrido el suceso B. Esta probabilidad P(A1/
B) denominada a posteriori se determina a través del conocimiento de la probabilidad absoluta del
evento A1 (a priori; P(A1)) y de la probabilidad condicionada P(B/A1) de la forma siguiente:

P ¢ A1 £D P ¢B / A1£
P ¢ A1 / B£ =
P ¢ A1 £ DP ¢B / A1£ A P ¢ A 2£ DP ¢B / A2£

donde P(A2) es la probabilidad del complemento del evento A1.


"" | Estadística médica | Línea de métodos cuantitativos

Ejemplo 7.5.1. Suponga que la prevalencia de la tuberculosis es 20%. Existe


una prueba para detectarla y se sabe que si un individuo padece esta enfermedad
la prueba da positiva un 90% de las veces. Si se realiza la prueba a un individuo
sano la probabilidad de que la prueba sea positiva es de 0,15. Se elige al azar a
una persona y se le realiza la prueba.
¿Cuál es la probabilidad de que la persona en realidad padezca tuberculosis dado
que la prueba fue positiva?
Solución. Primero desglosamos los datos de la letra:
Probabilidad de presentar tuberculosis P(A1)=0,20
Aplicando la regla del complemento obtenemos la Probabilidad de no presentar
tuberculosis = P(A2)=1-0,2=0,8
Sea B la prueba es positiva entonces: P(B/A1)=0,90 y P(B/A2)=0,15
Con ayuda del Teorema de Bayes podemos contestar la pregunta planteada:

P ¢ A1 £D P ¢B / A1£
P ¢ A1 / B£ =
P ¢ A1 £D P ¢B / A1£ AP ¢ A2 £D P ¢B / A2 £

¢ 0,20£¢ 0,90£ 0,18


P ¢ A1 / B£ = = = 0,60
¢ 0,20£¢ 0,90£ A¢ 0,80£¢ 0,15£ 0,30

¿Qué nos dice este resultado? Si una persona se selecciona en forma aleatoria
de la población la probabilidad de presentar tuberculosis es de 0,20. Si a dicha
persona se le aplica la prueba y resulta positiva, la probabilidad de que en
realidad presente dicha enfermedad aumenta aproximadamente 3 veces de 0,20 a
0,60.

Si bien el problema anterior está formado sólo por dos eventos, A1 y A2, en otros casos pueden
existir más de dos probabilidades. En estos casos el denominador del teorema de Bayes necesita
términos adicionales.

P ¢ A1£ DP ¢ B / A1£
P ¢ A1 / B£ =
P ¢ A1 £D P ¢B / A1£ AP ¢ A2 £D P ¢B / A2 £A .. A P ¢An £D P ¢B / An £

donde A1, A2,...., An son todos eventos mutuamente excluyentes. En una forma reducida pode-
mos reescribir la ecuación de la siguiente manera:

¢ £ ¢
P A1 D P B / A 1 £
¢
P A1 / B =£ n
i =1,2,...,n
Œ ¢P ¢Ai £DP ¢B / Ai ££
i =1

Ejemplo 7.5.2. Un paciente trae a la consulta un análisis de orina en 24 horas


que muestra un volumen de orina igual 382 cc. De los registros médicos de la
institución de salud se pueden obtener las probabilidades de presentar
oligoanuria (volumen de orina 200 - 400 cc/24hs) en presencia de: una patología
Estadística médica | Línea de métodos cuantitativos | "#

prerrenal P(S/A)= 0,75; una patología renal P(S/B)= 0,62; una patología
postrenal P(S/C)= 0,005. Además se cuenta con estudios que determinan una
prevalencia para las distintas causas de oligoanuria: P(A)= 0,009; P(B)= 0,03;
P(C)= 0,005.
¿Cuál es la probabilidad para las tres causas de oligoanuria (prerrenal, renal y
postrenal) frente al resultado del análisis de orina?
Solución. Suponiendo que los eventos A, B y C son mutuamente excluyentes
podemos por medio del teorema de Bayes obtener las probabilidades
consultadas: P(A/S), P(B/S) y P(C/S).

P ¢ A£ DP ¢S / A£
P ¢ A / S£ = =
P ¢ A£ DP ¢S / A£ AP ¢B £ DP ¢S / B£ AP ¢C £D P ¢S / C £
0,00 D 0,75
= 0,006 / 0,02 = 0,27
0,00 D 0,75A 0,03 D 0,62 A 0,00 D 0,00

P ¢B £ DP ¢S / B£
P ¢B / S£ = =
P ¢ A£ DP ¢S / A£ AP ¢B £ DP ¢S / B£ AP ¢C £D P ¢S / C £
¢ 0,03D0,62£ / 0,02 =0,73

P ¢ C£ DP ¢S / C £
P ¢C / S£ = =
P ¢ A£ DP ¢S / A£ AP ¢B £D P ¢S / B £ AP ¢C £D P ¢S / C £
¢ 0,00 D0,00 £ / 0,02 =0,001

7.6. TASAS Y RAZONES


En medicina las tasas y razones son utilizadas como una medida de la ocurrencia de los sucesos
enfermedad y muerte. Las tasas que veremos en esta sección son indicadores epidemiológicos de la
probabilidad, que presentan particularidades que las hacen merecedoras de un tratamiento separa-
do dentro de este capítulo. Lo que se intenta es describir la susceptibilidad frente a los sucesos
enfermedad y muerte de un conjunto determinado de individuos a los que se denomina pobla-
ción en riesgo. Por ello, veremos que una tasa es un cociente cuyo numerador es el número de
individuos en los que se presenta el evento (nº de enfermos o muertos) y el denominador es la
suma de los tiempos de observación de cada individuo de la población en riesgo, el periodo libre
del evento. Dicha población debe estar determinada en el espacio y en el tiempo, siendo necesario
delimitar en los estudios las características de los individuos, la región y el periodo de tiempo de la
observación. Una tasa es una expresión de la forma:

¢£
n

Œe i
i =1
Tasa = n
Dk i =1,2,...,n
Πti
i =1

donde Œei es la suma de los individuos enfermos o muertos en un periodo determinado, Œti es la
sumatoria de los tiempos en que los individuos de la población en riesgo están libres del evento
(persona-tiempo de exposición) y k es una constante (eje: 10, 100, 1.000, 10.000) denominada

También podría gustarte