Está en la página 1de 57

Área de Medicina Preventiva y Salud Pública

Relaciones entre variables.


Probabilidad

Profª. Ana Fernández Somoano


26-28 septiembre 2023
Área de Medicina Preventiva y Salud Pública

¿Qué vamos a estudiar?

1 Relaciones entre variables.

2 Probabilidad: conceptos y principales propiedades.

3 Aplicaciones a los métodos de diagnóstico.

4 Otras aplicaciones.
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


VARIABLE BIDIMENSIONAL

 Combinación de 2 variables: Distribución Bidimensional.


 Variable bidimensional (X, Y) → observación simultánea de dos
características sobre cada individuo.
 Permite el análisis por separado de cada característica y el análisis conjunto.

Ejemplos:

Tablas de altura - peso de una muestra extraída de una población


Relación pulso - temperatura de un grupo de enfermos
Relación peso - colesterol de un grupo de enfermos de corazón
Relación hábito de fumar - nº de caries de un grupo de estudiantes
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DISTRIBUCIÓN BIDIMENSIONAL

FRECUENCIA ABSOLUTA del par (xi, yj), nij : Número de individuos de


una muestra para los que X toma el valor xi e Y toma el valor yj.

FRECUENCIA RELATIVA del par (xi, yj), fij : Proporción de individuos de


una muestra para los que X toma el valor xi e Y toma el valor yj, y se
nij
calcula como .
n
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


REPRESENTACIONES TABULARES

• Tabla de doble entrada (o tabla de


contingencia si se consideran frecuencias
absolutas) → valores repetidos muchas
veces (cualitativas y discretas).

• Tabla de datos apareados → valores poco


repetidos y no muy numerosos.
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


REPRESENTACIONES GRÁFICAS

• Diagrama de dispersión (o nube de


puntos): dos variables cuantitativas.

• Diagramas de cajas: una variable


cualitativa y una cuantitativa.

• Diagrama de barras agrupadas: dos


variables cualitativas o una cualitativa y
una cuantitativa discreta.
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DISTRIBUCIONES MARGINALES

 Recogen el comportamiento de cada una de las variables por separado

Distribución marginal de X

xi\yi y1 y2 … yj … yl
x1 n11 n12 … n1j … n1l n1.
x2 n21 n22 … n2j … n2l n2.
:̇ :̇ :̇ :̇ :̇ :̇
Frecuencia absoluta marginal de xi
xi ni1 ni2 … nij … nil ni.
ni. = ni1 +ni2 +…+nil = ∑lj=1 nij
:̇ :̇ :̇ :̇ :̇ :̇
xk nk1 nk2 … nkj … nkl nk.
Distribución marginal de Y n.1 n.2 … n.j … n.l n

Frecuencia absoluta marginal de yj


n.j = n1j +n2j +…+nkj = ∑ki=1 nij
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DISTRIBUCIONES CONDICIONALES

 Recogen el comportamiento de una de las variables cuando se mantiene


fija la modalidad de la otra:

xi\yi y1 y2 … yj … yl
x1 n11 n12 … n1j … n1l n1.
x2 n21 n22 … n2j … n2l n2.
:̇ :̇ :̇ :̇ :̇ :̇
xi ni1 ni2 … nij … nil ni.
𝐧𝐧𝐢𝐢𝐢𝐢 𝐟𝐟𝐢𝐢𝐢𝐢 Frecuencia de xi
:̇ :̇ :̇ :̇ :̇ :̇ 𝐟𝐟(𝐱𝐱 𝐢𝐢 ⁄𝐲𝐲𝐣𝐣 ) = =
𝐧𝐧.𝐣𝐣 𝐟𝐟.𝐣𝐣 condicionada por yj
xk nk1 nk2 … nkj … nkl nk.
n.1 n.2 … n.j … n.l n Distribución de X condicionada por Y=yj, (X/Y=yj)

𝐧𝐧𝐢𝐢𝐢𝐢 𝐟𝐟𝐢𝐢𝐢𝐢 Distribución de Y


𝐟𝐟(𝐲𝐲𝐣𝐣⁄𝐱𝐱𝐢𝐢) = = Frecuencia de yj condicionada por xi condicionada por X=xi,
𝐧𝐧𝐢𝐢. 𝐟𝐟𝐢𝐢.
(Y/X=xi)
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


Ejemplo: y2=“Fumador”
Y=Hábito de fumar 8. Hábito de Fumar
Nunca fumador Fumador Ex-fumador Total
3. Estado Casado/a o Recuento 540 80 478 1098
X=Estado civil
civil convive en Recuento esperado 633,0 77,4 387,6 1098,0
pareja % dentro de 3. Estado civil 49,2% 7,3% 43,5% 100,0%
% dentro de 8. Hábito de 48,9% 59,3% 70,7% 57,3%
Fumar
% del total 28,2% 4,2% 25,0% 57,3%
Soltero/a Recuento 74 17 52 143
𝟏𝟏𝟏𝟏
x2 Recuento esperado 82,4 10,1 50,5 143,0
𝐟𝐟(𝐱𝐱 𝟐𝟐 ⁄𝐲𝐲𝟐𝟐 ) = =
% dentro de 3. Estado civil 51,7% 11,9% 36,4% 100,0% 𝟏𝟏𝟏𝟏𝟏𝟏
% dentro de 8. Hábito de 6,7% 12,6% 7,7% 7,5% = 𝟎𝟎, 𝟏𝟏𝟏𝟏𝟏𝟏 (𝟏𝟏𝟏𝟏, 𝟔𝟔𝟔)
Fumar
% del total 3,9% 0,9% 2,7% 7,5%
Viudo/a Recuento 480 26 128 634
Recuento esperado 365,5 44,7 223,8 634,0
% dentro de 3. Estado civil 75,7% 4,1% 20,2% 100,0%
% dentro de 8. Hábito de 43,5% 19,3% 18,9% 33,1%
Fumar
% del total 25,1% 1,4% 6,7% 33,1%
Separado/a o Recuento 10 12 18 40
divorciado/a Recuento esperado 23,1 2,8 14,1 40,0
% dentro de 3. Estado civil 25,0% 30,0% 45,0% 100,0%
% dentro de 8. Hábito de 0,9% 8,9% 2,7% 2,1%
Fumar
% del total 0,5% 0,6% 0,9% 2,1%
Total Recuento 1104 135 676 1915
Recuento esperado 1104,0 135,0 676,0 1915,0
% dentro de 3. Estado civil 57,7% 7,0% 35,3% 100,0%
% dentro de 8. Hábito de 100,0% 100,0% 100,0% 100,0%
� 𝐟𝐟(𝐱𝐱 𝐢𝐢 ⁄𝐲𝐲𝐣𝐣 ) = 𝟏𝟏 (𝟏𝟏𝟏𝟏𝟏𝟏𝟏)
Fumar
𝐢𝐢
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


Ejemplo: 𝟏𝟏𝟏𝟏
y2 𝐟𝐟(𝐲𝐲𝟐𝟐 ⁄𝐱𝐱 𝟐𝟐 ) = = 𝟎𝟎, 𝟏𝟏𝟏𝟏𝟏𝟏 (𝟏𝟏𝟏𝟏, 𝟗𝟗𝟗)
Y=Hábito de fumar 8. Hábito de Fumar
𝟏𝟏𝟏𝟏𝟏𝟏
Nunca fumador Fumador Ex-fumador Total
3. Estado Casado/a o Recuento 540 80 478 1098
X=Estadocivilcivil convive en Recuento esperado 633,0 77,4 387,6 1098,0
pareja % dentro de 3. Estado civil 49,2% 7,3% 43,5% 100,0%
% dentro de 8. Hábito de 48,9% 59,3% 70,7% 57,3%
Fumar
% del total 28,2% 4,2% 25,0% 57,3%

x2=“Soltero”
Soltero/a Recuento
Recuento esperado
74
82,4
17
10,1
52
50,5
143
143,0
� 𝐟𝐟(𝒚𝒚𝒋𝒋 ⁄𝒙𝒙𝒊𝒊 ) = 𝟏𝟏 (𝟏𝟏𝟏𝟏𝟏𝟏𝟏)
% dentro de 3. Estado civil 51,7% 11,9% 36,4% 100,0% 𝒋𝒋
% dentro de 8. Hábito de 6,7% 12,6% 7,7% 7,5%
Fumar
% del total 3,9% 0,9% 2,7% 7,5%
Viudo/a Recuento 480 26 128 634
Recuento esperado 365,5 44,7 223,8 634,0
% dentro de 3. Estado civil 75,7% 4,1% 20,2% 100,0%
% dentro de 8. Hábito de 43,5% 19,3% 18,9% 33,1%
Fumar
% del total 25,1% 1,4% 6,7% 33,1%
Separado/a o Recuento 10 12 18 40
divorciado/a Recuento esperado 23,1 2,8 14,1 40,0
% dentro de 3. Estado civil 25,0% 30,0% 45,0% 100,0%
% dentro de 8. Hábito de 0,9% 8,9% 2,7% 2,1%
Fumar
% del total 0,5% 0,6% 0,9% 2,1%
Total Recuento 1104 135 676 1915
Recuento esperado 1104,0 135,0 676,0 1915,0
% dentro de 3. Estado civil 57,7% 7,0% 35,3% 100,0%
% dentro de 8. Hábito de 100,0% 100,0% 100,0% 100,0%
Fumar
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DEPENDENCIA ESTADÍSTICA

 Dos variables son estadísticamente independientes cuando el


comportamiento de una no influye en el comportamiento de la otra.

 X es independiente de Y si la distribución de frecuencias condicionada de X no


depende del valor o clase de Y por el que se condiciona, es decir, si cualquiera
que sea xi se cumple que:
f(xi/y1) = f(xi/y2) = … = f(xi/yl)

 Diremos que X e Y son estadísticamente independientes si:

fij = fi.* f.j para i=1, …, k, j=1, …,l


es decir, si:
n𝐢𝐢. ∗n.𝐣𝐣
n𝐢𝐢𝐢𝐢 = n para i=1, …, k, j=1, …,l
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DEPENDENCIA ESTADÍSTICA

Covarianza de X e Y, Cov(X, Y):


k l
1
� yj − Y
𝐒𝐒𝐗𝐗𝐗𝐗 = � � xi − X � ∗ nij = 𝐗𝐗 � 𝐘𝐘 − 𝐗𝐗
� � 𝐘𝐘

n
i=1 j=1

 Si las variables X e Y son estadísticamente


independientes, la covarianza es cero.

 Si Cov (X,Y) = 0 puede suceder que X e Y sean


dependientes.
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DEPENDENCIA ESTADÍSTICA

Propiedades de la covarianza:

Si a todos los valores de la variable X, les sumamos una constante k y a todos
los valores de la variable Y les sumamos una constante k’, la covarianza no varía.

Si todos los valores de una variable X los multiplicamos por una constante k y
todos los valores de la variable Y los multiplicamos por una constante k’, su
covarianza queda multiplicada por el producto de las constantes.
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DEPENDENCIA ESTADÍSTICA

 Si hay dependencia directa o positiva entre X e Y (a grandes valores de x


corresponden grandes valores de y), la covarianza es positiva.

 Si hay dependencia inversa o negativa entre X e Y (a grandes valores de x


corresponden pequeños valores de y), la covarianza es negativa.
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DEPENDENCIA FUNCIONAL

 Regresión: relación funcional de cierto tipo (lineal, exponencial,


hiperbólica, potencial, etc.) que mejor expresa una variable estadística
en función de la otra en la muestra, y = f(x).
Buscar la curva que mejor se ajusta al diagrama de puntos que
representa la distribución de frecuencias conjunta en la muestra.

 Correlación: complementa el estudio de regresión, cuantificando el


grado de dependencia entre las dos variables de acuerdo con la mejor
relación obtenida por regresión.
 Grado de ajuste de la curva que representa la relación óptima al
diagrama de puntos.
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DEPENDENCIA LINEAL

Regresión lineal: busca la recta de la forma Y* = a* + b*�X que menos


diste (en distancia cuadrática vertical) del diagrama de puntos.

Y* = a* + b*�X
a* → término independiente
b* → pendiente (coeficiente de regresión)

Y− a∗ +b∗X 2= min Y − a + bX 2
a,b ∈ℜ
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DEPENDENCIA LINEAL

Correlación lineal: cuantifica el grado de relación lineal entre dos variables.

S 𝐗𝐗𝐗𝐗
Coeficiente de correlación lineal de Pearson para X e Y = r𝐗𝐗𝐗𝐗 =
SS
𝐗𝐗 𝐘𝐘

r𝟐𝟐𝐗𝐗𝐗𝐗 : coeficiente de determinación

 Las dos variables deben ser cuantitativas.


Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DEPENDENCIA LINEAL

 El coeficiente r𝐗𝐗𝐗𝐗 es adimensional (no tiene unidades) y toma valores en el intervalo [-1, 1].

 El coeficiente de regresión tiene el mismo signo que S𝐗𝐗𝐗𝐗 y que b: coeficiente de


correlación positivo ⇒cada variable es función lineal estrictamente creciente de la otra, y
coeficiente de correlación negativo ⇒cada variable es estrictamente decreciente de la
otra.

 Si r𝟐𝟐𝐗𝐗𝐗𝐗 = 1, la dependencia lineal entre las variables X e Y en la muestra es total.

 Cuanto más se aleje r𝟐𝟐𝐗𝐗𝐗𝐗 del valor 1, mayor error se comete al suponer que X e Y dependen
linealmente, por lo que la dependencia lineal entre las variables es menor.
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DEPENDENCIA LINEAL

 Cuando r𝐗𝐗𝐗𝐗 = 𝟎𝟎 se dice que las variables están incorreladas o son


linealmente independientes.
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DEPENDENCIA LINEAL

b>0

Y* = a + b�X

b<0

Dependencia Dependencia Dependencia


estadística estadística estadística
débil fuerte perfecta
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DEPENDENCIA LINEAL

(Los valores estimados en la regresión coinciden con los valores reales)

Correlación perfecta Correlación nula Correlación perfecta


𝐫𝐫𝐗𝐗𝐗𝐗 = -1 𝐫𝐫𝐗𝐗𝐗𝐗 = 0 𝐫𝐫𝐗𝐗𝐗𝐗 = +1
𝐫𝐫𝐗𝐗𝐗𝐗 = -0,8 𝐫𝐫𝐗𝐗𝐗𝐗 = -0,6 𝐫𝐫𝐗𝐗𝐗𝐗 = -0,4 𝐫𝐫𝐗𝐗𝐗𝐗 = 0,4 𝐫𝐫𝐗𝐗𝐗𝐗 = 0,6 𝐫𝐫𝐗𝐗𝐗𝐗 = 0,8

Correlación baja (No recomendable aplicar regresión lineal)

Correlación moderada
Correlación alta
Correlación muy alta
CORRELACIÓN NEGATIVA CORRELACIÓN POSITIVA
Área de Medicina Preventiva y Salud Pública

1. Relaciones entre variables.


DEPENDENCIA LINEAL

 Las variables en la correlación son recíprocas o simétricas. En ningún


momento se habla de que una de ellas sea la “causa” y la otra el
“efecto”. En la correlación no se distingue la variable dependiente de la
independiente.

 En cambio esta simetría no se da en la regresión.

 No basta que un coeficiente de correlación sea muy elevado para


considerar que la asociación entre dos variables sea causal, hay que
pensar en terceras variables que puedan explicar la asociación
encontrada.
Área de Medicina Preventiva y Salud Pública

2. Probabilidad: conceptos y principales propiedades


IDEA INTUITIVA

La probabilidad es un número, entre 0 y 1, asociado con


la verosimilitud de que ocurra un suceso
(0 cuando estamos seguros que el suceso no va a ocurrir
y 1 cuando estamos seguros que sí va a ocurrir).

¿cómo asignar ese número en situaciones de incertidumbre?

 Si afirmamos que la probabilidad de que un fármaco cure a un enfermo


es 0,7 (70%), es como decir que al prescribir el fármaco a 100 enfermos
esperaríamos que curase a 70 y fracasase en 30, como lo más probable.
Área de Medicina Preventiva y Salud Pública

2. Probabilidad: conceptos y principales propiedades


ELEMENTOS DE LOS EXPERIMENTOS ALEATORIOS

 Experimento aleatorio: proceso cuyo resultado no se puede predecir antes de realizarlo,


depende del azar.

Ejemplo: clasificación de la gravedad de una lesión deportiva; medida de la temperatura corporal.

Espacio muestral: es el conjunto formado por todos los posibles resultados de un


experimento aleatorio (E).
Ejemplo: E=leve, media, grave; E = conjunto de posibles valores de la temperatura en la población.

Suceso aleatorio cada subconjunto de E que identifica los elementos


que cumplen cierta propiedad (A).
Ejemplo: A= leve; A = menos de 35°; A = entre 35° y 37°

 Elemental: un único elemento.


 Compuesto: varios elementos.
Área de Medicina Preventiva y Salud Pública

2. Probabilidad: conceptos y principales propiedades


ELEMENTOS DE LOS EXPERIMENTOS ALEATORIOS

 Dados dos sucesos A y B, el E


suceso unión es aquel que se A B
verifica cuando ocurre al menos A∪B
uno de ellos (es decir, ocurre o
bien sólo uno de ellos, o ambos,
A ó B).
E
 Dados dos sucesos A y B, el
A B
suceso intersección es aquel
que se verifica cuando ocurren A∩B
simultáneamente ambos, A y B.
Área de Medicina Preventiva y Salud Pública

2. Probabilidad: conceptos y principales propiedades


ELEMENTOS DE LOS EXPERIMENTOS ALEATORIOS

 Suceso complementario de A,
�), es el que se
o contrario a A, (A
produce cuando no se produce A.

 Sucesos incompatibles aquellos cuya realización simultánea es


imposible (A∩B= ø).

 Suceso imposible como su nombre indica es imposible que ocurra, será


el correspondiente al subconjunto vacío (ø).

 Suceso seguro será el que siempre ocurre, se corresponderá con E.


Área de Medicina Preventiva y Salud Pública

2. Probabilidad: conceptos y principales propiedades


PROBABILIDAD

Probabilidad: función que asocia, a cada suceso A, un número real que


indica la posibilidad con la que ocurre, P(A).

Reglas de la teoría axiomática de la probabilidad:

1. 0≤P(A)≤1
2. Si A y B son incompatibles, P(A∪B)=P(A)+P(B)
 P(E)=1
 P(imposible)=P(ø)=0
 P(A �)=P(no A)=1-P(A)
 Si A y B pueden ocurrir a la vez, P(A∪B)=P(A)+P(B)-P(A∩B)
Área de Medicina Preventiva y Salud Pública

2. Probabilidad: conceptos y principales propiedades


PROBABILIDAD

nº casos favorables nº elementos de A


 Definición clásica: P(A)= =
nº casos posibles nº elementos de E
(necesita que E sea finito y que todos sus elementos sean equiprobables)

nº veces que aparece A (nA)


 Definición frecuentista: P(A)= lim fA = lim
n→∞ nº realizaciones del experimento (n)
cuando se realiza muchas veces el experimento
 En general, queremos conocer probabilidades de sucesos definidos sobre la población, pero
estudiando sólo una muestra, por lo que en muchas circunstancias son aproximadas (se estiman)
por las frecuencias relativas muestrales.

 Definición subjetiva: credibilidad de que un suceso ocurra (se irá actualizando


con el conocimiento).
Área de Medicina Preventiva y Salud Pública

2. Probabilidad: conceptos y principales propiedades


PROBABILIDAD CONDICIONADA

Probabilidad condicionada: probabilidad de que ocurra el suceso A


sabiendo que ha ocurrido el suceso B (P(B)≠0), P(A/B).

P(A∩B)
P(A/B)=
P(B)
Área de Medicina Preventiva y Salud Pública

2. Probabilidad: conceptos y principales propiedades


PROBABILIDAD CONDICIONADA

Ejemplo: estamos valorando la presencia de glucosa en orina (glucosuria) en


pacientes diabéticos y en pacientes no diabéticos y que hemos obtenido la
siguiente tabla:
Diabetes No Total
Diabetes
Glucosuria 60 8 68
No Glucosuria 140 792 932
Total 200 800 1000

¿Cuál es la probabilidad de que un diabético presente glucosuria?


P(Glucosuria 𝐲𝐲 Diabetes) 60
P(Glucosuria/Diabetes)= = = 0,3 (30 %)
P(Diabetes) 200
Área de Medicina Preventiva y Salud Pública

2. Probabilidad: conceptos y principales propiedades


SUCESOS INDEPENDIENTES

El suceso A es independiente del suceso B cuando la


probabilidad de que ocurra A no depende de la probabilidad de
que ocurra B, es decir, si y sólo si P(A/B)=P(A).

 Si A es independiente de B, B será independiente de A, es decir, P(B/A)=P(B).

 Si el suceso A es independiente del suceso B, la probabilidad de que ocurran los


dos a la vez es el producto de las probabilidades de ambos:

P(A∩B)
P(A/B)= = P(A) ⇒ P(A ∩ B) = P(A)P(B)
P(B)
 Si dos sucesos son independientes también lo son sus complementarios.
Área de Medicina Preventiva y Salud Pública

2. Probabilidad: conceptos y principales propiedades


SUCESOS INDEPENDIENTES

Ejemplo: ¿Los sucesos “Glucosuria” y “Diabetes” son independientes?


Diabetes No Diabetes Total
Glucosuria 60 8 68
No 140 792 932
Glucosuria
Total 200 800 1000

Para comprobarlo, tendremos que calcular la probabilidad de presentar


glucosuria,
68
P(Glucosuria)= = 0,068 (6,8%) ≠ P(Glucosuria/Diabetes)
1000

⇒ No son independientes
Área de Medicina Preventiva y Salud Pública

2. Probabilidad: conceptos y principales propiedades


REGLA DE LA PROBABILIDAD TOTAL

Una partición de E es un conjunto de sucesos Ai (i=1, …, n)


mutuamente excluyentes y que cubren todo el espacio muestral:
A1∪A2∪... ∪An = E y Ai∩Aj = ∅ si i≠j

 Regla de la probabilidad total:

Si un conjunto de sucesos Ai (i=1, …, n) forman una partición del espacio


muestral y para todo i, P(Ai)>0, entonces para cualquier otro suceso B se
cumple:

P(B) = P (B/A1) P(A1) + P (B/A2) P(A2)+ …+ P (B/An) P(An) = ∑ni=1 P(B/Ai) P(Ai)
Área de Medicina Preventiva y Salud Pública

2. Probabilidad: conceptos y principales propiedades


TEOREMA DE BAYES

 Teorema de Bayes:

Si un conjunto de sucesos Ai (i=1, …, n) forman una partición del espacio


muestral y para todo i, P(Ai)>0, entonces para cualquier otro suceso B tal
que P(B)>0, se cumple:

P(Ai∩B) P(B/Ai)P(Ai)
P(Ai/B) = = para i=1, …, n
P(B) j=1 P(B/Aj) P(Aj)
∑n
Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico

 Los test diagnósticos son una aplicación del Teorema de Bayes a la


Medicina.

 Un test diagnóstico se utiliza para detectar la presencia de alguna


condición específica en un experimento (prueba que se aplica a
un individuo para saber si padece una determinada enfermedad).

 Una prueba diagnóstica ayuda a mejorar una estimación de la


probabilidad de que un individuo presente una enfermedad.
Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico


ESPACIO MUESTRAL ASOCIADO A ENFERMEDAD Y PRUEBA DIAGNÓSTICA

Resultados en enfermedad Resultados en la prueba diagnóstica


Enfermo (E) Positivo (+)
No enfermo (E� ) Negativo (-)

 Los resultados de la prueba diagnóstica dependerán del estado en


enfermedad.
 Una vez realizada la prueba diagnóstica, las probabilidad de los resultados en
enfermedad debe verse modificada según el resultado obtenido en la prueba
diagnóstica.
Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico


SITUACIÓN UNA VEZ APLICADO EL TEST

 Que la condición esté presente y el test detecta su presencia: no se


ha cometido ningún error.

Que la condición esté presente, pero el test no detecta su


presencia: se ha cometido un error (Resultado Falso-Negativo).

Que la condición no esté presente, pero el test detecta su


presencia: se ha cometido un error (Resultado Falso-Positivo).

 Que la condición no esté presente y el test no indica su presencia:


no se ha cometido ningún error.

Test ideal: aquel en el que la probabilidad de cometer cualquier error es pequeña.


Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico


SITUACIÓN UNA VEZ APLICADO EL TEST

Resultados en
Espacio muestral enfermedad
enfermedad-prueba (patrón de oro)
E E� TOTAL FALSOS
POSITIVOS
Resultados en + a b n1
la prueba - c d n0
TOTAL m1 m0 n

BIEN
FALSOS NEGATIVOS
CLASIFICADOS
Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico


PROBABILIDAD DE RESULTADOS DE LA PRUEBA DIAGNÓSTICA

Sensibilidad: probabilidad de diagnosticar a un individuo como enfermo


cuando realmente lo está, es la capacidad del test para detectar la
a
enfermedad (capacidad de captación de la prueba), P(+/E) (= ).
m1
Especificidad: probabilidad de diagnosticar a un individuo como sano
cuando realmente lo está, es la capacidad del test para detectar a los
d
sanos (capacidad de discriminación de la prueba), P(-/ E�) (= ).
m0

c
Error “falso negativo”: P(-/E)= 1 – Sensibilidad (= )
m1
b
Error “falso positivo”: P(+/E� )= 1 – Especificidad (= )
m0
Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico


PROBABILIDAD DE RESULTADOS DE LA ENFERMEDAD

Valor predictivo positivo: probabilidad de que un individuo que resulta


positivo a la prueba, realmente esté enfermo, VPP = P(E/+).
Valor predictivo negativo: probabilidad de que un individuo que resulta
negativo a la prueba, realmente esté sano, VPN = P(E�/-).

 Indican con qué seguridad un test predecirá la presencia o ausencia de una enfermedad.
 Estos valores se modifican dependiendo de la proporción de individuos de la población
que en un momento dado padecen la enfermedad, P(E) (prevalencia de la enfermedad
o probabilidad a priori de estar enfermo).
Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico


PROBABILIDAD DE RESULTADOS DE LA ENFERMEDAD

 Como E y E� son una partición, usando el Teorema de Bayes:

P(+/E)�P(E)
VPP = P(E/+) = � ,y
P(+/E)�P(E) + P(+/E)
� �P(E)

P(−/E)
� �P(E)

VPN = P(E� /-) =
P(−/E)�P(E) + P(−/E)
� �P(E)

 A mayor P(E), aumenta el VPP y disminuye el VPN.


 A menor P(E), disminuye el VPP y aumenta el VPN.
Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico


EVALUACIÓN DE LA BONDAD DE UNA PRUEBA DIAGNÓSTICA

Buena prueba diagnóstica → ofrece resultados + en enfermos y - en sanos

 Es conveniente que el test:


• Sea sencillo de aplicar
• Aceptado por los pacientes
• Tenga los mínimos efectos adversos
• Económicamente soportable.

 Validez: la sensibilidad y la especificidad de un test son medidas


de su validez

 Seguridad: viene determinada por el valor predictivo de un


resultado positivo o negativo.
Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico

Ejemplo: nueva prueba para la detección precoz de una enfermedad con P(E)=0,5%
en una población.
Resultados en
Espacio muestral enfermedad
enfermedad-prueba
E E� TOTAL

Resultados en + 190 120 310


la prueba - 10 680 690
TOTAL 200 800 1000

Se desea cuantificar la sensibilidad, especificidad, falsos positivos y negativos de la


prueba, y los valores predictivos positivo y negativo.
Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico

190
Nº de verdaderos positivos: 190 Sensibilidad: P(+/E) = 200 = 0,95 (95%)
Nº de verdaderos negativos: 680 Especificidad: P(-/E�) = 680
800
= 0,85 (85%)
Nº de falsos positivos: 120 Proporción falsos positivos: P(+/E�) = 120800
= 0,15 (15%)
Nº de falsos negativos: 10 10
Proporción falsos negativos: P(-/E) = 200 = 0,05 (5%)

Valor predictivo positivo: P(E/+) = P(+/E)�P(+/E) �P(E)


=
0,95�0,005
P(E) + P(+/E)�P(E) 0,95�0,005 + 0,15�(1−0,005)
� � = 0,0308 3,08%

0,85�(1−0,005)
Valor predictivo negativo: P(E�/-) = P(−/E)�P(−/ E)�P(E)
� �
P(E) + P(−/E) � = 0,05�0,005 + 0,85�(1−0,005) = 0,9997
� �P(E) 99,97%
Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico

Ejemplo 2: la prueba se aplica ahora en un servicio hospitalario donde la P(E)=30%.

Veamos cuales son los valores predictivos de la prueba.


Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico

Sensibilidad: P(+/E) = 0,95 (95%)


Especificidad: P(-/E� ) = 0,85 (85%)
Proporción falsos positivos: P(+/E� ) = 0,15 (15%)
Proporción falsos negativos: P(-/E) = 0,05 (5%)

Valor predictivo positivo: P(E/+) = P(+/E)�P(+/E) �P(E)


� � =
0,95�0,30
P(E) + P(+/E)�P(E) 0,95�0,30 + 0,15�(1−0,30)
= 0,7308 (73,08%)

0,85�(1−0,30)
Valor predictivo negativo: P(E�/-) = P(−/E)�P(−/ E)�P(E)
� �
=
P(E) + P(−/E)�P(E) 0,05�0,30 + 0,85�(1−0,30)
� � = 0, 9754 (97,54%)
Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico

Supongamos que el test PCR que diagnostica la COVID-19 tiene una


sensibilidad promedio del 75 %, y una especificidad cercana al 99 %.
Área de Medicina Preventiva y Salud Pública

3. Aplicaciones a los métodos de diagnóstico

Si la proporción de la población afectada por la COVID-19 fuera de un 5%, es decir, 5


de cada cien personas estuvieran infectadas por COVID-19, y una persona que reside
en una ciudad de 100.000 habitantes decide realizarse el test PCR, si da positivo,
¿cuál es la probabilidad de que esté contagiada por COVID-19?

Infección
COVID-19
E E� TOTAL

+ 3750 950 4700


PCR
- 1250 94050 95300
TOTAL 5000 95000 100000

3750
P(contagiada por COVID19 si test PCR+)=P(E/+)=VPP= 4700 ≈ 0,80 (80%)
Área de Medicina Preventiva y Salud Pública

4. Otras aplicaciones
RIESGO RELATIVO Y ODDS RATIO DE UN FACTOR DE RIESGO

ENFERMOS NO ENFERMOS TOTAL


EXPUESTOS a b n1
NO
EXPUESTOS c d n0
TOTAL m1 m0 n

a
R1= P(Enfermo/Expuesto): R1 P(Enfermo/Expuesto)
n1 Riesgo relativo (RR): =
c R0 P(Enfermo/No expuesto)
R0= P(Enfermo/No expuesto):
n0
Área de Medicina Preventiva y Salud Pública

4. Otras aplicaciones
RIESGO RELATIVO Y ODDS RATIO DE UN FACTOR DE RIESGO

ENFERMOS NO ENFERMOS TOTAL


EXPUESTOS a b n1
NO
EXPUESTOS c d n0
TOTAL m1 m0 n
a
Proporción de expuestos en enfermos (pe1):
m1
pe1 a/m1 a/m1 a Razón de odds (OR):
Odds de exposición en enfermos (oddse1= ): = =
1−pe1 1−a/m1 c/m1 c
b oddse1 a/c a×d
Proporción de expuestos no enfermos (pe0): = =
m0 oddse0 b/d b×c
pe0 b/m0 b/m0 b
Odds de exposición en no enfermos (oddse0 = ): = =
1−pe0 1−b/m0 d/m0 d
Área de Medicina Preventiva y Salud Pública

EJERCICIOS
Área de Medicina Preventiva y Salud Pública

• Estudiamos la talla, medida en cm. y el peso, medido en kg. de un grupo


de 10 personas, y obtenemos los siguientes valores:

Talla (cms) 160 165 168 170 171 175 175 180 180 182
Peso (kgs) 55 58 58 61 67 62 66 74 79 83

• ¿Son independientes las variables?


• ¿Existe relación entre ellas? Calcula el grado de relación lineal.
Área de Medicina Preventiva y Salud Pública

• En un estudio llevado a cabo en España, once pacientes con


hipertrigliceridemia se sometieron a una dieta baja en grasas y
alta en carbohidratos. Antes de comenzar la dieta, se analizaron
los niveles de colesterol (X) y triglicéridos (Y) en cada paciente: X(mmol/l) Y(mmol/l)
5,12 2,30
6,18 2,54
6,77 2,95
6,65 3,77
6,36 4,18
• Calcular el coeficiente de correlación lineal de Pearson. 5,90 5,31
5,48 5,53
6,02 8,83
10,34 9,48
8,51 14,20
7,53 10,10
Área de Medicina Preventiva y Salud Pública

 Sabiendo que las variables X e Y son independientes, completar la siguiente


tabla de contingencia:

Y 1,50-1,65 1,65-1,80 1,80-1,95 ni.


X
55-70 1 16
70-85 10
85-100
n.j 35 112
Área de Medicina Preventiva y Salud Pública

 Supongamos que queremos estudiar la Incidencia (nº de casos nuevos de una


enfermedad que se desarrollan en una población durante un período de
tiempo determinado) del hecho de ser fumador como factor de riesgo, en el
desarrollo de una enfermedad en una determinada población. Para ello se
diseñó un estudio y se seleccionó una muestra de 180 sujetos.

Enfermos (E) Sanos Total


Fumador (F) 60 10 70
No Fumador (NF) 20 90 110
Total 80 100 180

• Calcular: P(E) ; P(E/F) ; P(E/NF) ; P(F) ; P(NF) ; P(F∩E) ; P(NF∩E)


Área de Medicina Preventiva y Salud Pública

 Para estudiar la eficacia de un nuevo test para el diagnóstico de un tipo


particular de cáncer que lo padece el 1% de las mujeres de edad avanzada,
se aplicó el mismo a un grupo amplio de mujeres con tal tipo de cáncer y a
otro grupo de mujeres sanas, obteniéndose la siguiente tabla:

Cáncer
E E� TOTAL

Resultados + 850 45 895


del test - 150 1455 1605
TOTAL 1000 1500 2500

a) Estima la sensibilidad y la especificidad de la nueva prueba diagnóstica.


b) Si elegida una persona y aplicado el test, este da positivo, ¿qué
probabilidad tiene de padecer la enfermedad?
c) ¿Cuál es el valor predictivo negativo de esta prueba diagnóstica?
Área de Medicina Preventiva y Salud Pública

La siguiente tabla muestra la distribución por tramos de edad tanto


de una población como de los casos positivos de COVID-19:

Tramos  ¿cuál es la probabilidad de que de una persona entre 18 y 40


Población Casos
de edad años elegida al azar en la población sea positivo por COVID-19?
<5 1.166.146 1.065
5-17 3.104.422 2.673  Si elegimos al azar una persona, ¿cuál es la probabilidad de que
18-49 8.220.531 29.045 sea positivo y esté entre 60 y 69 años?
50-59 2.232.733 6.624
 Si elegimos al azar un caso positivo, ¿cuál es la probabilidad de
60-69 1.499.917 3.748 que esté entre 60 y 69 años?
70-79 879.498 1.785
>=80 470.756 1.108  ¿es independiente o no tener 60-69 años y dar positivo por
COVID-19?

También podría gustarte