Está en la página 1de 14

Bioestadística e introducción a la investigación – Grado en Odontología

Curso 2022-2023

Tema 1. Estadística descriptiva

Departamento de Estatística, Análise Matemática e Optimización (USC)

Índice
1 Experimento aleatorio. Espacio muestral. Suceso 2

2 Definiciones de probabilidad. 3

3 Asignación de probabilidades: regla de Laplace. 4

4 Probabilidad condicionada. Independencia de sucesos. Regla del producto. 5

5 Ley de probabilidades totales. Teorema de Bayes. 8

6 Pruebas diagnósticas. 9
6.1 Prevalencia e incidencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
6.2 Tests de diagnóstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
6.3 Medidas relativas: odds, riesgo relativo, odds-ratio . . . . . . . . . . . . . . . . . . . . . 11

7 Ejercicios 12

1
Bioestadística e introducción a la investigación Tema 2. Probabilidad

1 Experimento aleatorio. Espacio muestral. Suceso


Cuando de un experimento podemos averiguar de alguna forma cuál va a ser su resultado antes de
que se realice, decimos que el experimento es determinístico. Así, podemos considerar que las horas
de salida del Sol, o la pleamar o bajamar son deterministas, pues podemos leerlas en el periódico
antes de que se produzcan. Por el contrario, no podemos encontrar en ningún medio el número
premiado en la Lotería de Navidad antes del sorteo, o nuestra presión arterial antes de medirla.
En esta materia estudiaremos experimentos que no son deterministas, pero no estamos interesados
en todos ellos. Por ejemplo, no podremos estudiar un experimento del que, por no saber, ni siquiera
sabemos por anticipado el listado de los posibles resultados que se pueden obtener. No realizaremos
tareas de adivinación. Por ello definiremos experimento aleatorio como aquel que verifique ciertas
condiciones que nos permitan un estudio riguroso del mismo.
Llamaremos experimento aleatorio al que satisface los siguientes requisitos:

 todos sus posibles resultados son conocidos de antemano,

 el resultado particular de cada realización del experimento es imprevisible,


 el experimento se puede repetir indefinidamente en condiciones idénticas,
 se pueden asignar probabilidades a los resultados del experimento.

Espacio muestral: es el conjunto formado por todos los resultados posibles del experimento aleatorio.
Lo denotamos por Ò.
Suceso: es cualquier subconjunto del espacio muestral.
Suceso elemental: es un suceso unitario, es decir, está constituido por un solo resultado del
experimento aleatorio.
Decimos que ha ocurrido un suceso cuando se ha obtenido alguno de los resultados que lo forman.

Ejemplo 1
Si lanzamos una moneda, el espacio muestral será Ò = {c, +}.

Ejemplo 2
Si lanzamos un dado, el espacio muestral será Ò = {1, 2, 3, 4, 5, 6}. Podemos considerar muchos
sucesos, por ejemplo: A =‘‘que salga par’’= {2, 4, 6}, B =‘‘que salga múltiplo de 3’’= {3, 6} o C =‘‘que
salga 2’’, siendo este último un suceso elemental.

El objetivo de la Teoría de la Probabilidad es estudiar con rigor los sucesos, que como vemos se
pueden enunciar desde el lenguaje común, asignarles probabilidades y efectuar cálculos sobre las
mismas. Observamos que los sucesos no son otra cosa que conjuntos y por tanto, serán tratados
desde la Teoría de Conjuntos. Recordamos a continuación las operaciones básicas y las dotamos de
interpretación para el caso de sucesos.
Suceso seguro: es el que siempre ocurre y, por tanto, coincide el espacio muestral, Ò.
Suceso imposible: es el que nunca ocurre y, por tanto, es el vacío, ∅.
Unión: ocurre A ∪ B si ocurre al menos uno de los sucesos A o B.
Intersección: ocurre A ∩ B si ocurren los dos sucesos A y B a la vez.
Complementario: ocurre A c si y sólo si no ocurre A.
Diferencia de sucesos: ocurre A − B (también se escribe A\B) si ocurre A y no ocurre B.
Sucesos incompatibles: dos sucesos A y B se dicen incompatibles si no pueden, esto es, A ∩ B = ∅.
Suceso contenido en otro: diremos que A está contenido en B, y lo denotamos por A ⊂ B, si siempre
que ocurra A también sucede B, esto es, todo elemento de A es también un elemento de B.

2
Bioestadística e introducción a la investigación Tema 2. Probabilidad

Ejemplo 3
Estudiamos el experimento aleatorio consistente en el lanzamiento de un dado, y consideramos los
sucesos A =‘‘que salga par’’= {2, 4, 6}, B =‘‘que sea múltiplo de tres’’= {3, 6}.
El suceso , ‘‘que salga par y múltiplo de tres’’ se puede expresar como intersección: A ∩ B = {2, 4, 6} ∩
{3, 6} = {6}. De la misma manera, el suceso ‘‘que salga par o múltiplo de tres’’ se puede expresar como
unión: A ∪ B = {2, 4, 6} ∪ {3, 6} = {2, 3, 4, 6}.

A continuación detallamos algunas propiedades esenciales en Teoría de Conjuntos que son de


aplicación para sucesos:
Propiedades

Asociativa A ∪ (B ∪ C) = (A ∪ B) ∪ C A ∩ (B ∩ C) = (A ∩ B) ∩ C
Conmutativa A∪B = B ∪A A∩B = B ∩A
Distributiva A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
Neutro ∅ para la unión A∪∅ = A
Ò para la intersección A∩Ò = A
Complementario A ∪ Ac = Ò A ∩ Ac = ∅
Leyes de de Morgan (A ∪ B)c = A c ∩ B c (A ∩ B)c = A c ∪ B c

Los diagramas de Venn son representaciones gráficas que nos permiten visualizar de manera sencilla
las relaciones entre dos o más conjuntos. Cada conjunto se representa mediante un círculo o un
óvalo, mientras que el recuadro exterior abarca a todos los elementos bajo consideración, en este
contexto el espacio muestral.

A B A B
A∩B A−B

2 Definiciones de probabilidad.
Comenzaremos esta sección introduciendo lo que se conoce como la definición axiomática de
Kolmogorov, que es una de las formas posibles de definir formalmente el concepto de Probabilida.

Definición 1
Sea Ò el espacio muestral, y sea P(Ò) el conjunto formado por todos los sucesos. Se define la
probabilidad como una aplicación  : P(Ò) −→ [0, 1] que cumple las siguientes condiciones:

 (Ò) = 1
La probabilidad del suceso seguro es 1.
 Dada una familia de sucesos A1 , A2 , . . . , A i , . . . en Ò, disjuntos dos a dos, A i ∩ A j = ∅, entonces se
verifica que:

 ¼
 ∪∞ i=1 i A = (A i ).
i=1

 Dado cualquier suceso A, entonces, 0 ≤ (A) ≤ 1.

3
Bioestadística e introducción a la investigación Tema 2. Probabilidad

Propiedades
A partir de la definición anterior se pueden obtener una serie de propiedades de la probabilidad:

1. (A c ) = 1 − (A).
2. Si A ⊂ B, entonces (A) ≤ (B).
3. Regla de la suma. Si A y B son dos sucesos cualesquiera (ya no necesariamente incompatibles)
se cumple
(A ∪ B) = (A) + (B) − (A ∩ B).

4. (A − B) = (A) − (A ∩ B).

3 Asignación de probabilidades: regla de Laplace.


Dado un experimento aleatorio, con su colección de sucesos, nos preguntamos cómo tenemos que
actuar para asignarle a cada suceso un número entre 0 y 1 de forma que se respeten los dos axiomas
de la definición de probabilidad.
Cuando el espacio muestral es finito, el problema se reduce a asignar probabilidades a los sucesos
elementales. Las probabilidades de los demás sucesos se obtendrán sumando las de los sucesos
elementales que lo componen (suma finita).
Sin duda el caso más fácil es aquél en el que no tenemos razones para suponer que unos sucesos
sean más probables que otros. Cuando, siendo el espacio muestral Ò finito, todos los sucesos
elementales tienen la misma probabilidad, diremos que son equiprobables y podremos utilizar la
conocida Regla de Laplace:
nº de casos favorables al suceso A
(A) = .
nº de casos posibles

Ejemplo 4
Lanzamos dos dados y sumamos sus puntuaciones. ¿Cuál es la probabilidad de obtener un 2?, ¿y de
obtener un 7?
Solución. En el experimento de lanzar dos dados, hay 36 resultados posibles, que son:

(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)


(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
(1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)

Estos 36 resultados son equiprobables, es decir, cada uno de ellos ocurriría con probabilidad 1/36.
Consideramos el suceso A:‘‘que al lanzar dos dados obtengamos una suma igual a 2’’.
Sólo hay un resultado favorable al suceso A y es ‘‘que salga el (1,1)’’,
entonces:
n.º de resultados favorables al suceso A 1
(A) = =
n.º de resultados posibles 36

Consideremos el suceso B=‘‘que al lanzar dos dados obtengamos una suma igual a 7’’.
Hay seis resultados favorables al suceso B, que son:

4
Bioestadística e introducción a la investigación Tema 2. Probabilidad

‘‘que salga el (1,6) o el (6,1) o el (2,5) o el (5,2) o el(3,4) o el (4,3)’’,


entonces:
n.º de resultados favorables al suceso B 6 1
(B) = = = .
n.º de resultados posibles 36 6


4 Probabilidad condicionada. Independencia de sucesos. Regla


del producto.
Supongamos que en el estudio de un experimento aleatorio nos interesa conocer la probabilidad
de que ocurra un cierto suceso A. Pero puede ser que dispongamos de información previa sobre
el experimento: supongamos que sabemos que el suceso B ha ocurrido. Está claro que ahora la
probabilidad de A ya no es la misma que cuando no sabíamos nada sobre B. Por ejemplo, si lanzamos
un dado, la probabilidad de que salga 1 es 1/6, pero si disponemos de la información adicional de que
el resultado es impar reducimos los casos posibles de 6 a 3 (solo puede ser un 1, un 3 o un 5), con lo
cual la probabilidad es 1/3.

Definición 2
Se define la probabilidad del suceso A condicionada al suceso B se define:

(A ∩ B)
(A|B) = , siendo (B) , 0
(B)

También se deduce de manera inmediata que

(A ∩ B) = (A) ∗ (B|A) = (B) ∗ (A|B)

Ejemplo 5
Se estima que el 30% de los habitantes de un determinado país son obesos y que el 3% sufre diabetes.
Además se sabe que el 2% es obeso y padece diabetes. ¿Cuál es la probabilidad de que una persona
elegida aleatoriamente sea obesa o sufra diabetes? Si se ha elegido una persona que no es obesa,
¿cuál es la probabilidad de que padezca diabetes? Y si se ha elegido una persona obesa, ¿cuál es la
probabilidad de que padezca diabetes?
Solución. Tenemos los siguientes sucesos:
A:‘‘que un individuo elegido al azar esté obeso"
B:‘‘que un individuo elegido al azar sufra diabetes"
Y la información que nos proporciona el enunciado del problema es la siguiente:
(A) = 0.3
(B) = 0.03
(A ∩ B) = 0.02
Se pide:
(A ∪ B) = (A) + (B) − (A ∩ B) = 0.3 + 0.03 − 0.02 = 0.31
(B ∩ A c ) (B − A) (B) − (A ∩ B) 0.03 − 0.02 00 01
(B | A c ) = = = = = 0 = 0.0143
(A c ) 1 − (A) 1 − p(A) 1 − 00 3 07
(A ∩ B) 0.02
(B | A) = = = 0.0667 
(A) 0.3

Definición 3
Dos sucesos A y B son independientes si y solo si

(A ∩ B) = (A) ∗ (B)

5
Bioestadística e introducción a la investigación Tema 2. Probabilidad

Observaciones
 Si (B) > 0, A y B son independientes si y sólo si (A|B) = (A), esto es, el conocimiento de la
ocurrencia de B no modifica la probabilidad de ocurrencia de A.
 Si (A) > 0, A y B son independientes si y sólo si (B|A) = (B), esto es, el conocimiento de la
ocurrencia de A no modifica la probabilidad de ocurrencia de B.
 No debemos confundir sucesos independientes con sucesos incompatibles: los sucesos incom-
patibles son los más dependientes que puede haber. Por ejemplo, si en el lanzamiento de una
moneda consideramos los sucesos incompatibles ‘‘salir cara’’ y ‘‘salir cruz’’, el conocimiento de
que ha salido cara nos da el máximo de información sobre el otro suceso: ya que ha salido cara
es imposible que haya salido cruz.
Propiedad
Dados dos sucesos con probabilidades no nulas e incompatibles, entonces no son independien-
tes.
Demostración. Consideremos, entonces, A y B, sucesos incompatibles, es decir:
A∩B =∅
entonces:
(A ∩ B) = 0
pero si fuesen independientes, como (A) , 0 y (B) , 0, tendríamos:
(A ∩ B) = (A) ∗ (B) , 0,
lo cual contradice el resultado anterior.
Por lo tanto, no pueden ser independientes si son incompatibles. 

 Si los sucesos A y B son independientes, también lo son los sucesos A y B c ; los sucesos A c y B;
y los sucesos A c y B c .

Ejemplo 6
En una unidad asistencial se atiende a 300 pacientes, de los cuales 185 son menores de 45 años y
115 son mayores de esa edad. De los 185 menores de 45 años, 15 presentan periodontitis, mientras
que de los 115 mayores de 45 años, 90 padecen esta dolencia. ¿Son independientes los sucesos
‘‘padecer periodontitis" y ‘‘ser mayor de 45 años"?
Solución. Tenemos los siguientes sucesos:
A:‘‘ser mayor de 45 años"
B:‘‘padecer periodontitis"
Y la información que nos proporciona el enunciado del problema es la siguiente:
115
(A) = = 0.383
300
15 + 90
(B) = = 0.35
300
90
(A ∩ B) = = 0.3
300
Para comprobar si A y B son independientes, tenemos que ver si:
(A ∩ B) = (A) ∗ (B)
Calculamos entonces:
(A) ∗ (B) = 0.383 ∗ 0.35 = 0.134
Y por otro lado:
(A ∩ B) = 0.3
Por lo tanto, A y B no son independientes, pues:
(A ∩ B) , (A) ∗ (B) 
| {z } | {z }
0.3 0.134

6
Bioestadística e introducción a la investigación Tema 2. Probabilidad

Regla del producto.


Si tenemos los sucesos A1 , A2 , . . . , A n y no son incompatibles, esto es (A1 ∩ A2 ∩. . .∩ A n ) , 0, entonces
se cumple

(A1 ∩ A2 ∩ . . . ∩ A n ) = (A1 ) ∗ (A2 |A1 ) ∗ (A3 |A1 ∩ A2 ) · · · (A n |A1 ∩ A2 ∩ . . . ∩ A n−1 )

Se utiliza en experimentos aleatorios que están formados por etapas consecutivas (de la 1 a la n) y
nos permite calcular la probabilidad de que ocurra una concatenación (intersección) de sucesos a lo
largo de las etapas (A1 en la primera etapa y A2 en la segunda etapa y . . . y A n en la etapa n). Esta
probabilidad queda expresada como el producto de la probabilidad inicial (A1 ) y las probabilidades
en cada etapa condicionadas a las etapas anteriores, conocidas como probabilidades de transición.

Ejemplo 7
La primera aplicación de un insecticida mata al 80% de los mosquitos. Los supervivientes desarrollan
resistencia y en cada aplicación posterior el porcentaje de muertos se reduce a la mitad del verifi-
cado en la aplicación inmediatamente anterior: así en la segunda aplicación muere el 40% de los
supervivientes de la primera aplicación, en la tercera aplicación muere el 20%, etc.

(a) ¿Cuál es la probabilidad de que un mosquito sobreviva a cinco aplicaciones?


(b) Idem, dado que sobrevivió a las dos primeras.

Solución. Si denotamos A i :‘‘que un mosquito elegido al azar sobreviva a la aplicación i-ésima", con i = 1, 2, 3, 4, 5,
hay que calcular:
(a) (A1 ∩ A2 ∩ A3 ∩ A4 ∩ A5 ) =
= (A1 ) ∗ (A2 |A1 ) ∗ (A3 |A1 ∩ A2 ) ∗ (A4 |A1 ∩ A2 ∩ A3 ) ∗ (A5 |A1 ∩ A2 ∩ A3 ∩ A4 )
= 0.20 ∗ 0.60 ∗ 0.80 ∗ 0.90 ∗ 0.95 = 0.08208

(b) (A3 ∩ A4 ∩ A5 |A1 ∩ A2 ) = 0.8 ∗ 0.9 ∗ 0.95 = 0.684 

Ejemplo 8
Vamos a ilustrar el uso de la probabilidad condicionada con un ejemplo de la genética clásica
considerando el caso del color de guisante como un rasgo codificado por un gen que tiene dos alelos.
El alelo dominante, que denotaremos por Y, codifica el color amarillo del guisante. El alelo recesivo,
que denotaremos por y, codifica el color verde del guisante. Suponiendo que son diploides, los
guisantes pueden tener un genotipo que es homocigoto (yy o YY) o heterocigoto (Yy o yY). Suponiendo
iguales frecuencias para ambos alelos, la probabilidad de un heterocigoto es 1/2, y la probabilidad de
un homocigoto es también 1/2. La probabilidad de un guisante verde (guisantes de genotipo yy) es 1/4,
y la probabilidad de un guisante amarillo (guisantes de genotipo YY, Yy, e yY) es 3/4.
Se elige un guisante al azar, calcular la probabilidad de que sea heterozigoto y amarillo.
Se elige un guisante al azar y es amarillo, calcular la probabilidad de que sea heterocigoto.
Solución. Tenemos los sucesos:
A: ‘‘que un guisante elegido al azar sea amarillo’’
V: ‘‘que un guisante elegido al azar sea verde’’
Het: ‘‘que un guisante elegido al azar sea heterozigoto’’
Hom: ‘‘que un guisante elegido al azar sea homozigoto’’
Y la información que aporta el enunciado es la siguiente:
1 1 3 1
(Hom) = , (Het) = , (A) = y (V) = , entonces:
2 2 4 4
2
 (A ∩ Het) = .
4
(A ∩ Het) 2
 (Het | A) = = .
(A) 3

7
Bioestadística e introducción a la investigación Tema 2. Probabilidad

5 Ley de probabilidades totales. Teorema de Bayes.


La ley de las probabilidades totales descompone la probabilidad de un suceso relativo a la segunda
etapa en función de lo que ocurrió en la etapa anterior. Antes de enunciar el resultado damos una
definición.
Definición 4
Dada una colección de sucesos A1 , A2 , . . . , A n (subconjuntos del espacio muestral), se dice que forman
un sistema completo de sucesos si verifican que A1 ∪ A2 ∪ . . . ∪ A n = Ò (son exhaustivos, cubren
todo el espacio muestral) y además son incompatibles dos a dos (si se verifica uno de ellos, no puede
a la vez ocurrir ninguno de los otros).

Ley de las probabilidades totales.


Sea A1 , A2 , . . . , A n un sistema completo de sucesos, entonces se cumple que:

(B) = (A1 ) ∗ (B|A1 ) + (A2 ) ∗ (B|A2 ) + · · · + (A n ) ∗ (B|A n )

Ejemplo 9
Se sabe que una enfermedad es padecida por el 7% de los fumadores y por el 2.5% de los no
fumadores. Si en una población de 5.000 habitantes hay 600 fumadores, ¿cuál es la probabilidad de
que una persona elegida al azar sufra dicha enfermedad?
Solución. Tenemos los siguientes sucesos:
F :‘‘que un individuo elegido al azar sea fumador"
E:‘‘que un individuo elegido al azar padezca la enfermedad"
La información que nos proporcionan es la siguiente:
(E|F ) = 0.07
(E|F c ) = 0.025
600
(F ) = = 0.12
5000
Se pide:
(E) = (E|F ) ∗ (F ) + (E|F c ) ∗ (F c ) =
= 0.07 ∗ 0.12 + 0.025 ∗ (1 − 0.12) = 0.0084 + 0.022 = 0.0304 

Ahora consideremos un experimento que se realiza en dos etapas: en la primera, tenemos un sistema
completo de sucesos A1 , A2 , . . . , A n con probabilidades (A i ) que denominamos probabilidades a priori.
En una segunda etapa, ha ocurrido el suceso B y se conocen las probabilidades condicionadas
(B|A i ) de obtener en la segunda etapa el suceso B cuando en la primera etapa se obtuvo el suceso
A i , i = 1, . . . , n.
En estas condiciones el teorema de Bayes permite calcular las probabilidades (A i |B), que son
probabilidades condicionadas en sentido inverso. Reciben el nombre de probabilidades a posteriori,
pues se calculan después de haber observado el suceso B.
Teorema de Bayes.
En las condiciones anteriores,
(A i ∩ B) (A i ) ∗ (B|A i )
(A i |B) = =
(B) (A1 ) ∗ (B|A1 ) + (A2 ) ∗ (B|A2 ) + · · · + (A n ) ∗ (B|A n )

Este teorema resulta de aplicar en el numerador la regla del producto y en el denominador la ley de
probabilidades totales.

Ejemplo 10
La distribución de los grupos sanguíneos en Estados Unidos en la Segunda Guerra Mundial era: tipo
A, 41%; tipo B, 9%; tipo AB, 4%; y tipo O, 46%. Se estima que en esa época, el 4% de las personas

8
Bioestadística e introducción a la investigación Tema 2. Probabilidad

pertenecientes al tipo O fue clasificado como del tipo A; el 88% de los del tipo A fue correctamente
clasificado; el 4% de los del tipo B se clasificó como del tipo A; y el 10% de los del tipo AB fue,
igualmente, clasificado como del tipo A. Un soldado fue herido y conducido a la enfermería. Se le
clasificó como del tipo A. ¿Cuál es la probabilidad de que tal grupo sea ciertamente el suyo?
Solución. La información que tenemos es:
A:‘‘que un individuo elegido al azar tenga grupo sanguíneo A"
B:‘‘que un individuo elegido al azar tenga grupo sanguíneo B"
AB:‘‘que un individuo elegido al azar tenga grupo sanguíneo AB"
O:‘‘que un individuo elegido al azar tenga grupo sanguíneo O"
CA:‘‘que un individuo elegido azar sea clasificado en el grupo sanguíneo A"
(A) = 0.41, (B) = 0.09, (AB) = 0.04, (O) = 0.46, (CA|O) = 0.04, (CA|A) = 0.88, (CA|B) = 0.04 y
(CA|AB) = 0.10. Se pide:
(CA|A) ∗ (A)
(A|CA) = =
(CA)
(CA|A) ∗ (A)
= =
(CA|A) ∗ (A) + (CA|B) ∗ (B) + (CA|AB) ∗ (AB) + (CA|O) ∗ (O)
0.88 ∗ 0.41
= =
0.88 ∗ 0.41 + 0.04 ∗ 0.09 + 0.10 ∗ 0.04 + 0.04 ∗ 0.46
0.3608
= = 0.9328 
0.3868

6 Pruebas diagnósticas.

6.1 Prevalencia e incidencia

Incidencia y prevalencia son términos comúnmente utilizados en epidemiología para conocer el


estado de salud de la población.
La prevalencia de una enfermedad mide la proporción de casos (de esa enfermedad) en un instante
dado. (La prevalencia del suceso ‘‘que un individuo elegido al azar padezca la enfermedad en
cuestión’’.) Se obtiene calculando el cociente del número de casos (enfermos) y el número (total) de
individuos de la población de interés, en un instante dado.
La incidencia de una enfermedad mide la proporción de nuevos casos que ocurren durante un
período especificado de tiempo. La incidencia se obtiene calculando el cociente del número de casos
nuevos ocurridos durante el período de tiempo especificado y el número (total) de individuos de la
población de riesgo (el conjunto de individuos con riesgo de desarrollar la enfermedad en ese período
de tiempo, bajo la hipótesis de que ese riesgo permanece constante a lo largo del período de tiempo
especificado).

Observación 1
La prevalencia mide la existencia de la enfermedad (el todo), la incidencia mide la aparición de la
enfermedad (lo nuevo).
Es fácil estimar la prevalencia de una enfermedad, pero a menudo no es sencillo determinar el
denominador en el cálculo de la incidencia porque el tamaño de la población puede cambiar a lo
largo del tiempo (no siempre se sabe cuántas personas estuvieron en riesgo durante el período de
estudio). Es habitual sustituir el denominador por el promedio de los tamaños de población conocidos
durante el período de tiempo especificado (la media de los tamaños de la población al comienzo y al
final del estudio).

9
Bioestadística e introducción a la investigación Tema 2. Probabilidad

6.2 Tests de diagnóstico

Una de las aplicaciones de la probabilidad en el campo biosanitario es la evaluación de pruebas


diagnósticas. Una prueba diagnóstica es una herramienta para detectar la presencia o no de una
condición específica; generalmente intentamos detectar la presencia de una enfermedad, un factor
genético o alguna otra condición en los individuos de la población en estudio.
Veamos algunos de los conceptos esenciales que nos permitirán llevar a cabo esa evaluación de
cualquier prueba diagnóstica.

Se llama sensibilidad de un test a la probabilidad de que dicho test conduzca a un resultado positivo
supuesto que el sujeto presente la característica.
Se llama especificidad de un test a la probabilidad de que el resultado del test sea negativo cuando
el sujeto no presenta la característica.
Se llama valor predictivo positivo de un test a la probabilidad de que un individuo presente la
característica cuando el resultado del test ha sido positivo.
Se llama valor predictivo negativo de un test a la probabilidad de que un individuo no presente la
característica cuando el resultado del test ha sido negativo.

Estos valores tienen una interpretación muy clara respecto de la calidad de la prueba. Así, interesa
emplear pruebas (o métodos diagnósticos) que posean una alta sensibilidad y especificidad, así como
valores predictivos positivo y negativo grandes.

Ejemplo 11
Un equipo médico de investigación desea evaluar la utilidad de una cierta prueba en el diagnóstico de
una enfermedad. En una muestra aleatoria de 150 individuos que padecían la enfermedad la prueba
dio positivo en 135 de ellos. En otra muestra independiente de 800 individuos sin la enfermedad, la
prueba dio positivo en 20 de ellos. Se sabe, además, que la tasa de la enfermedad en la población de
estudio es 0.02.
Definimos los sucesos de interés como:
E:‘‘que en un individuo, elegido al azar, esté presente la enfermedad",
T + :‘‘que en un individuo, elegido al azar, la prueba dé positivo",
T − :‘‘que en un individuo, elegido al azar, la prueba dé negativo".
El enunciado aporta la siguiente información:
135 20
(E) = 0.02, (T + |E) = 150 y (T + |E c ) = 800 .
Tenemos:

135
Sensibilidad = (T + |E) = = 0.9
150
20
Especificidad = (T − |E c ) = 1 − (T + |E c ) = 1 − = 1 − 0.025 = 0.975
800
VP+ = Valor predictivo positivo = (E|T + ) =
(T + |E) ∗ (E)
= =
(T + )
(T + |E) ∗ (E)
= =
(T |E) ∗ (E) + (T + |E c ) ∗ (E c )
+

0.9 ∗ 0.02 0.018 0.018


= = = = 0.4236
0.9 ∗ 0.02 + 0.025 ∗ 0.98 0.018 + 0.0245 0.0425
VP- = Valor predictivo negativo = (E c |T − ) =
(T − |E c ) ∗ (E c )
= =
(T − )

10
Bioestadística e introducción a la investigación Tema 2. Probabilidad

(T − |E c ) ∗ (E c )
= =
(T − |E c ) ∗ (E c ) + (T − |E) ∗ (E)
0.975 ∗ 0.98 0.9555 0.9555
= = = = 0.9998
0.975 ∗ 0.98 + (1 − 0.9) ∗ 0.02 0.9555 + 0.0002 0.9557

A la vista de los resultados, podemos decir que la prueba diagnóstica es buena para detectar la
enfermedad, pues la sensibilidad y la especificidad son grandes, como también lo son los valores
predictivos positivo y negativo.
Si entramos en más detalle, la especificidad es muy alta, 0.975, mientras que la sensibilidad no lo es
tanto, 0.9. La sensibilidad indica la capacidad de detectar que una persona esté enferma, por lo que
quizá este test deje bastantes enfermos sin detectar: un 10% de ‘‘falsos negativos’’.
Por otro lado, la especificidad indica la capacidad de que a los sanos no se les diagnostique incorrecta-
mente un ‘‘falso positivo’’. De ahí el término especificidad, relacionado con el hecho de que el test sea
capaz de detectar solamente la enfermedad en cuestión (ser específico de dicha enfermedad). Por el
contrario, un análisis de sangre, por ejemplo, puede ser sensible para detectar muchas dolencias,
pero si pensamos en una en concreto, puede resultar poco específico para ella, pues las anomalías
que detecta el análisis de sangre pueden ser debidas a otras causas.
Con los datos de este ejemplo, la especificidad del 97.5% indica que en los individuos sin la enfer-
medad hay sólo un 2.5% de falsos positivos, que serían positivos debidos a otras causas.
Respecto de los valores predictivos positivo y negativo, son cantidades que permiten valorar el
resultado del test cuando se aplica en una experiencia clínica, para decidir sobre el estado de un
paciente en concreto. Lo interesante es que estos valores, no sólo dependen de la calidad técnica del
test diagnóstico, sino que también están influidos por la estructura de la población.
En nuestro caso el valor predictivo negativo es muy alto, porque el test es eficaz, pero también porque
en la población general hay una mayoría de individuos sanos. Sin hacer el test, la probabilidad de que
un individuo esté sano es de 0.98. Tras hacer el test, si el resultado es negativo, su probabilidad de
estar sano sube hasta 0.9998.
La probabilidad de padecer la enfermedad en la población general es de 0.02, mientras que tras dar
positivo asciende hasta 0.4236. 

Observación 2
Con el fin de interpretar el resultado de una prueba se necesita conocer los valores predictivos
de la misma. Por ejemplo, en el caso de una enfermedad rara (poco probable en la población de
estudio), una alta especificidad y una alta sensibilidad no son suficientes para asegurar que una gran
proporción de los que tienen la prueba positiva realmente tengan la enfermedad.

6.3 Medidas relativas: odds, riesgo relativo, odds-ratio

ODDS
Las probabilidades a favor o ventaja de un suceso A (la ODDS de un suceso) se define como el cociente
entre la probabilidad de que el suceso ocurra (probabilidad de éxito) y la probabilidad de que el suceso
no ocurra (probabilidad de fracaso). Podemos decir que la ODDS de un suceso nos indica cuánto más
probable es el éxito que el fracaso.
Para una enfermedad con una prevalencia de 0.25, las probabilidades a su favor son:
0.25 1
O D D S(A) = =
0.75 3
Si la enfermedad tiene una prevalencia de 0.8, las probabilidades a su favor son:
0.80 4
O D D S(A) = = = 4 (es cuatro veces más probable estar enfermo que no estarlo).
0.20 1
En las siguientes medidas relativas intervienen otros factores, por ejemplo, supongamos que la
enfermedad sea diabetes y consideremos el factor –o condición– obesidad. Si hablamos de los

11
Bioestadística e introducción a la investigación Tema 2. Probabilidad

pacientes que son obesos se dice que el paciente ha estado expuesto al factor obesidad. Veamos
ahora esas medidas relativas:
Riesgo Relativo (RR)
El riesgo relativo de un suceso con respecto a un factor o condición es:
probabilidad de que ocurra el suceso en el grupo expuesto al factor
RR =
probabilidad de que ocurra el suceso en el grupo no expuesto

Ejemplo 12
Supongamos que tenemos las siguientes probabilidades:
(“pad ecer d i abetes 00 | “obeso 00 ) = 0.025
(“pad ecer d i abetes 00 | “noobeso 00 ) = 0.005
entonces
0.025
RR = =5
0.005
es decir, el riesgo de padecer diabetes es cinco veces mayor en el grupo de los pacientes obesos que
en el grupo de los pacientes no obesos.
La odds ratio de un suceso con respecto a un factor o condición se define como:
ODDS del suceso en el grupo expuesto al factor
OR =
ODDS del suceso en el grupo no expuesto
Así, en el ejemplo anterior, tendríamos:
0.025
(1 − 0.025)
OR = = 5.10
0.005
(1 − 0.005)
Es decir, el factor obesidad es un factor de riesgo porque las probabilidades a favor de la diabetes en
el grupo de los pacientes obesos es aproximadamente cinco veces mayor que las probabilidades a
favor de la diabetes en el grupo de los pacientes no obesos.
Si el OR fuese menor que uno, entonces diríamos que ese factor o condición es un factor de protección.

Observación 3
Análogamente, se podrían definir estas medidas relativas para la incidencia de una enfermedad en
vez de considerar la prevalencia de la enfermedad.

7 Ejercicios
1. Los estudios epidemiológicos indican que el 20% de los ancianos sufren un deterioro neu-
rológico. Sabemos que la tomografía axial computerizada (TAC) es capaz de detectar este
trastorno en el 80% de los que lo sufren, y también que da un 3% de falsos positivos entre
personas sanas. Si tomamos un anciano al azar y da positivo en el TAC, ¿cuál es la probabilidad
de que esté realmente enfermo? Sol. 0.8696
2. En un laboratorio se analizan muestras de agua de mar para detectar la presencia de dos
metales pesados: plomo y mercurio. Por estudios previos se sabe que el 38% de las muestras
tomadas en las proximidades de la desembocadura de un río en cuyas orillas se localizan
numerosas plantas industriales tiene niveles tóxicos de plomo o de mercurio, y que el 32%
tienen nivel tóxico de plomo. Además, el 10% de las muestras de agua contienen un nivel alto
de ambos metales. ¿Cuál es la probabilidad de que una muestra contenga un alto nivel de
mercurio? ¿Cuál es la probabilidad de que una muestra contenga solamente plomo? Sol. 0.16 y
0.22 respectivamente.

12
Bioestadística e introducción a la investigación Tema 2. Probabilidad

3. En una población el 10% de los individuos tiene más de 65 años, y el 5% tiene periodontitis.
También se sabe que el 2% de los individuos tiene más de 65 años y tiene periodontitis. Eligiendo
un individuo al azar:

(a) Hallar la probabilidad de que el individuo tenga más de 65 años o tenga periodontitis. Sol.
0.13
(b) Si un individuo tiene más de 65 años, ¿cuál es la probabilidad de que tenga periodontitis?
Sol. 0.2
(c) Si un individuo no tiene más de 65 años, ¿cuál es la probabilidad de que tenga periodontitis?
Sol. 0.03

4. Para diagnosticar la colelitiasis se usan los ultrasonidos. Tal técnica tiene una sensibilidad del
91% y una especificidad del 98%. En la población que nos ocupa la probabilidad de colelitiasis
es del 20%.

(a) Si a un individuo de tal población se le aplican los ultrasonidos y dan positivo, ¿cuál es la
probabilidad de que sufra la colelitiasis? Sol. 0.9191
(b) Si el resultado fuese negativo, ¿cuál es la probabilidad de que no tenga la enfermedad?
Sol. 0.978

5. Un equipo médico de investigación está interesado en valorar la utilidad de un cierto síntoma


(que llamaremos S) en el diagnóstico de una enfermedad en particular. En una muestra
aleatoria de 775 pacientes con la enfermedad, 744 tenían el síntoma. En otra muestra aleatoria
independiente de 1.380 individuos sin la enfermedad, 21 informaron que tenían el síntoma.

(a) Calcular la sensibilidad del síntoma. Sol. 0.96


(b) Calcular la especificidad del síntoma.Sol. 0.9848

13
Bioestadística e introducción a la investigación Tema 2. Probabilidad

(c) Supongamos que se sabe que la tasa de la enfermedad en la población general es 0.001.
¿Cuál es el valor predictivo positivo del síntoma? Sol. 0.06
(d) ¿Cuál es el valor predictivo negativo? Sol. 0.9625
(e) Calcular el valor predictivo positivo y el valor predictivo negativo del síntoma para las
siguientes tasas de la enfermedad: 0.01 y 0.1.

6. En un estudio sobre la depresión, se conoce que al comienzo del año 2015 el 2% de los individuos
de una población de 1800 personas padecían depresión crónica. Al finales de junio de 2015,
el número de individuos que sufrían de depresión crónica aumentó a 50. Calcula la tasa de
incidencia de la depresión para el período de enero a junio de 2015 (suponiendo que el tamaño
de la población no ha cambiado), y la tasa de prevalencia de la depresión a finales de junio de
2015. Sol. 0.78% y 2.78% respectivamente.
7. Hay muchos factores que pueden influir en la condición de los dientes, como, por ejemplo, los
hábitos alimentarios, el cepillado dental, el uso de la seda dental o la fluoración. Consideremos
los siguientes sucesos:
A = "que un paciente, elegido al azar, se cepille sus dientes al menos dos veces al día",
B = "que un paciente use la seda dental al menos una vez al día",
C = "que un paciente viva en una ciudad con el agua de la traída fluorada".
Supongamos que:
P(A) = 0.55, (B) = 0.40, P(A ∩ B) = 0.25, P(C) = 0.75.
(a) ¿Son los sucesos A y B independientes? ¿Son los sucesos A y B incompatibles? Sol. No
son independientes ni incompatibles.
(b) Sabiendo que un paciente se cepilla los dientes al menos dos veces al día, ¿cuál es la
probabilidad de que use seda dental al menos una vez al día? Sol. 0.4545
(c) Supongamos que la probabilidad de que un paciente, elegido al azar en una ciudad con el
agua potable fluorada, use la seda dental por lo menos una vez al día es 0.30. Se elige
un paciente y resulta que usa la seda dental por lo menos una vez al día, ¿cuál es la
probabilidad de que viva en una ciudad con el agua potable fluorada? Sol. 0.5625
(d) ¿Son los sucesos B y C independientes? ¿Son los sucesos B y C incompatibles? Sol. No
son independientes ni incompatibles.
8. Uno de los factores principales que predisponen al fallo de un implante dental es la baja
densidad ósea. Se han realizado 220 implantes en 70 pacientes. Los resultados de los implantes
se muestran en la tabla siguiente:
Factor de riesgo Con fallo en el implante Sin fallo en el implante
Con baja densidad ósea 11 34
Sin baja densidad ósea 10 165
Calcúlese la odds ratio de que falle el implante con respecto al factor que tenga baja densidad
ósea, e interprétese el valor obtenido. Sol. 5.303
9. Supongamos que la probabilidad de que un sujeto tenga un determinado tipo de cáncer, dado
que es fumador, es 0.003, y la probabilidad de que un sujeto tenga cáncer, dado que no es
fumador, es 0.0001. Calcúlese el riesgo relativo y la odds ratio de que padezca ese tipo de
cáncer con respecto al factor que sea fumador. ¿Podemos decir que el tabaquismo es un factor
de riesgo del desarrollo de este tipo de cáncer? ¿Por qué? Sol. Sí lo es puesto que el riesgo
entre fumadores es 30 veces superior.
10. En enero de 2005, en una población de 50000 habitantes, había 825 personas con diabetes
mellitus. Además, entre enero y junio de ese año, se registraron 65 nuevos casos de diabetes
mellitus.
(a) Calcúlese la prevalencia de la diabetes en esa población, en enero de 2005. Sol. 1.65%
(b) Calcúlese la incidencia de la diabetes en el período comprendido entre enero y junio en
dicha población. Sol. 0.13%

14

También podría gustarte