Está en la página 1de 71

II.

Probabilidades
FENÓMENOS DETERMINÍSTICOS Y FENÓMENOS ALEATORIOS

 Uno de los significados del término fenómeno es el de


manifestación de actividad que se produce en la naturaleza.
 Los fenómenos deterministas son aquellos cuyos
resultados son predecibles.
 Los fenómenos aleatorios son los que no pueden
predecirse con certeza.
A menudo, los fenómenos que se observan en las
ciencias físico-químicas son deterministas.
 La complejidad de los fenómenos tratados en las
biociencias hace que éstos sean aleatorios y
normalmente sólo sean predecibles en términos de
probabilidad o esperanza.
Fenómenos determinísticos y aleatorios
 ¿Cuánto tiempo tarda en llegar al suelo un objeto que se
deja caer desde una altura de 320 metros?
1 2
𝑠= 𝑔 𝑡 ⟹ 𝑡=
2
2𝑠
𝑔
=
10√ √
2× 320
=8 𝑠

 Considérese un cierto gen con los alelos A y a. Si se


aparean dos sujetos heterocigotos Aa, ¿cuál será el
genotipo del descendiente?

{ 𝐴𝐴 , 𝐴𝑎 ,𝑎𝐴 , 𝑎𝑎 }
Espacio muestral
 El espacio muestral de probabilidad asociado a un fenómeno
aleatorio es el conjunto de todos los posibles resultados
elementales que puede manifestar ese fenómeno.
 Ejemplo 1. Apareamiento
◦ Sea un gen con alelos y supóngase que se aparean dos sujetos
heterocigotos Aa.
◦ Para este fenómeno aleatorio, el espacio muestral asociado es: .
 Ejemplo 2. Tiempo de supervivencia
◦ Considérese un paciente con una enfermedad de mal
pronóstico.
◦ El tiempo que transcurrirá desde el diagnóstico hasta su
muerte no es predecible con certeza y por tanto, tal fenómeno
es de naturaleza aleatoria.
◦ El espacio muestral es el conjunto de todos los posibles
tiempos de supervivencia:
Sucesos
 Para un fenómeno aleatorio, un suceso A es
cualquier subconjunto del espacio muestral
asociado E ( ).
 Para el problema del apareamiento Aa –Aa, el
suceso: “el descendiente es heterocigoto” se puede
expresar como: .

 Sucesos especiales
◦ Suceso seguro = Espacio muestral = E
◦ Suceso imposible = Conjunto vacío =
◦ Dado un suceso A, su contrario se expresa por y
consiste en el conjunto de todos los elementos de E
que no pertenecen al suceso A.
Operaciones con sucesos
Unión de sucesos
◦ La unión de dos sucesos A y B es el suceso
, que consiste en que ocurra A ó B (al
menos uno de los dos).

Intersección de sucesos
◦ La intersección de dos sucesos A y B es el
suceso , que consiste en que ocurran
ambos sucesos a la vez.
Operaciones con sucesos
 Para
el gen con alelos , considérese fenómeno del
apareamiento de dos heterocigotos Aa.
 Sean los sucesos:
◦ A = “Ser heterocigoto” =
◦ B = “Recibir del padre el alelo A” =
◦ Entonces:
Sucesos incompatibles
Dos sucesos A y B son incompatibles o
mutuamente excluyentes si no pueden
presentarse simultáneamente; esto es:

En el fenómeno aleatorio del apareamiento


de dos sujetos heterocigotos, considérense
los sucesos:
◦ Ser homocigoto =
◦ Ser heterocigoto =
Diagramas de Venn

• Supóngase que de la población de estudio se selecciona un


sujeto al azar.
• El espacio muestral asociado E es el conjunto de todos los
sujetos de la población (todos pueden ser elegidos).
• El suceso “Ser hipertenso” es el conjunto formado por los 324
sujetos hipertensos.
• ¿Cuál sería el suceso: “Ser hipertenso” ”Ser diabético” ?
Diagramas de Venn
Conceptos de probabilidad
 Laprobabilidad es una medida del grado de
creencia acerca de que un suceso pueda ocurrir.
 Laprobabilidad puede darse en diferentes
escenarios, a saber:
◦ Probabilidad exacta. Cuando puede determinarse con
plena objetividad.
◦ Probabilidad frecuentista. Cuando no pudiéndose dar con
plena objetividad, se aproxima por una larga secuencia de
observaciones del correspondientes al fenómeno aleatorio.
◦ Probabilidad subjetiva. Expresa una creencia personal
sobre la verosimilitud de un suceso.
Axiomática de la probabilidad
 SeaE el espacio muestral asociado a un fenómeno
aleatorio.
 Una medida de probabilidad sobre los sucesos de E
es cualquier función que a cada suceso le asigna un
número en el intervalo y que satisface los siguientes
axiomas:
◦ Pr( E ) = 1
◦ Si , entonces
Axiomática de la probabilidad

Pr ( 𝐴 ∪ 𝐵 )=Pr ( 𝐴 ) +Pr ( 𝐵 ) =0.35+0.30=0.65


Axiomática de la probabilidad

Pr ( 𝐴 ∪ 𝐵 )=Pr ( 𝐴 ) +Pr ( 𝐵 ) − Pr ( 𝐴∩ 𝐵 ) =0.50+0.45 −0.15=0.80


Propiedades de la probabilidad
Ley de Laplace
Sea E el espacio muestral finito asociado a un
fenómeno aleatorio y sea #(E) = N .

Supóngase que los elementos de E son


equiprobables.

Entonces, para cualquier suceso A se satisface:


Diagramas de Venn
Probabilidad condicionada
 Los siguientes datos corresponden a un estudio de
Scarmeas et al (2009) en el que una muestra
aleatoria de sujetos sanos se clasificaron en dos
cohortes, a saber: sujetos que realizaban alguna
actividad física (N = 1360) y sujetos sedentarios (N
= 520). Tras un periodo de seguimiento, se
determinaron las incidencias de la enfermedad de
alzheimer.
Alguna actividad física

Si (N = 1360) No (N = 520

Enfermedad de Alzheimer, n (%) 180 (13.2) 102 (19.6)


Probabilidad condicionada
 Supóngase que E es un espacio muestral finito de
elementos equiprobables. Se pretende definir:

 Parece razonable en este caso escribir:


Probabilidad condicionada
 Paraun suceso A tal que Pr( A ) > 0, la
probabilidad de otro suceso B condicionada por
A se define por:

 De
esta definición se deduce la siguiente ley
multiplicativa de la probabilidad:
Probabilidad condicionada
Demostrar la siguiente propiedad:
Independencia de sucesos
Un suceso B es independiente de A si:

Probar que si B es independiente de A,


entonces, A lo es de B.
◦ Si B es independiente de A,

◦ Ahora:
Independencia de sucesos
Dos sucesos A y B son independientes si:

De acuerdo con la ley multiplicativa de la


probabilidad, se tiene:

Pero al ser independientes,


Se tiene entonces finalmente:
Probar que si A y B son independientes, entonces y B
también los son.

Pr ( 𝐴 ⋂ 𝐵 )= Pr ( 𝐵 ) − Pr ( 𝐴 ∩ 𝐵 )= ¿ ¿
𝐶

Pr ( 𝐵 ) − Pr ( 𝐴 ) Pr ( 𝐵 ) ¿ Pr ( 𝐵 ) ( 1− Pr ( 𝐴 ) ) =Pr ( 𝐵 ) Pr ( 𝐴 )
𝐶
Evolución de los genotipos
 Considérese un gen con alelos {A,a}
 Ello supone que los genotipos posibles para este gen
sean: AA, Aa, aa
 Supóngase que en una cierta población, los genotipos se
dan según la siguiente tabla de frecuencia:
Genotipo AA Aa aa
Frecuencia p q r

siendo p + q + r =1
 Considérese ahora que de esta población se aparean dos
sujetos al azar.
 ¿Cuál es la probabilidad de que el descendiente tenga
genotipo Aa?
Evolución de genotipos
 La siguiente tabla resume la solución del problema:
Apareamiento
M1 = AA , AA 0 0
M2 = AA , Aa 1/2
M3 = AA , aa 1
M4 = Aa , Aa 1/2 /2
M5 = Aa , aa 1/2
M6 = aa , aa 0 0

6
𝑞2
Pr ( 𝐴𝑎 1) =∑ Pr ( 𝐴𝑎1|𝑀 𝑖 ) Pr ( 𝑀 𝑖 ) =𝑝𝑞+ 2𝑝𝑟 + +𝑞𝑟
𝑖=1 2
Sistema completo de sucesos
Sistema completo de sucesos
Un conjunto de sucesos forma un sistema
completo si:
Teorema de la probabilidad total
Teorema de la probabilidad total
Teorema de la probabilidad total
Teorema de la probabilidad total
Teorema de la probabilidad total
Teorema de la probabilidad total
Teorema de la probabilidad total

4 4
Pr ( 𝐵 ) =∑ Pr ( 𝐴 𝑖 ∩ 𝐵 )= ¿ ∑ Pr ( 𝐵 ∨ 𝐴 𝑖 ) Pr ( 𝐴 𝑖 ) ¿
𝑖=1 𝑖 =1
Teorema de la probabilidad total
Sea un sistema completo de sucesos.
Entonces, para cualquier suceso B se satisface:
Evolución de genotipos
 Considérese un gen con alelos {A,a}.
 Ello supone que los genotipos posibles para este gen
sean: AA, Aa, aa.
 Supóngase que en una cierta población, los genotipos se
dan según la siguiente tabla de frecuencia:
Genotipo AA Aa aa
Frecuencia p q r

siendo p + q + r =1
 Considérese ahora que de esta población se aparean dos
sujetos al azar.
 ¿Cuál es la probabilidad de que el descendiente tenga
genotipo Aa?
Evolución de genotipos
 La siguiente tabla resume la solución del problema:
Apareamiento
M1 = AA , AA 0 0
M2 = AA , Aa 1/2
M3 = AA , aa 1
M4 = Aa , Aa 1/2 /2
M5 = Aa , aa 1/2
M6 = aa , aa 0 0
6
𝑞2
Pr ( 𝐴𝑎 1) =∑ Pr ( 𝐴𝑎1|𝑀 𝑖 ) Pr ( 𝑀 𝑖 ) =𝑝𝑞+ 2𝑝𝑟 + +𝑞𝑟
𝑖=1 2
Tasas ajustadas por población
Edad, Población de Diabéticos Pr(D|Ti)Pr(Ti) Población
años Telde, % % SEGI, %
30 - 39 34.83 2.57 0.0257 × 0.3483 27.27

40 - 49 24.71 5.90 0.0590 × 0.2471 27.27

50 - 59 17.57 16.53 0.1653 × 0.1757 20.45

60 - 69 12.66 33.80 0.3380 × 0.1266 15.91

70 ó más 10.23 30.19 0.3019 × 0.1023 9.10

Suma 100 - 0.1263 100

6
Pr ( 𝐷 )=∑ Pr ( 𝐷∨𝑇 𝑖 ) Pr ( 𝑇 𝑖 ) =0.1263 (12.63 %)
𝑖=1
Tasas ajustadas por población
Edad, Población de Diabéticos Pr(D|Si)Pr(Si) Población
años Telde, % % SEGI, %
30 - 39 34.83 2.57 0.0257 × 0.2727 27.27

40 - 49 24.71 5.90 0.0590 × 0.2727 27.27

50 - 59 17.57 16.53 0.1653 × 0.2045 20.45

60 - 69 12.66 33.80 0.3380 × 0.1591 15.91

70 ó más 10.23 30.19 0.3019 × 0.0910 9.10

Suma 100 - 0.1381 100

6
Pr ( 𝐷 )=∑ Pr ( 𝐷∨𝑆𝑖 ) Pr ( 𝑆𝑖 ) =0.1 381(1 3. 81 %)
𝑖=1
Teorema de Bayes
 Sea un sistema completo de sucesos. Entonces,
para cualquier suceso B se satisface:

 En efecto:
Paternidad
 Considérese un gen con alelos {A,a}.
 Ello supone que los genotipos posibles para este gen sean:
AA, Aa, aa.
 Supóngase que en una cierta población, los genotipos se
dan según la siguiente tabla de frecuencia:
Genotipo AA Aa aa
Frecuencia p q r

siendo p + q + r =1
 Considérese ahora que de esta población se aparean dos
sujetos al azar.
 Supóngase que el descendiente es Aa. ¿Cuál es la
probabilidad de que descienda del apareamiento Aa , Aa?
Paternidad
 Mediante la formula de la probabilidad se obtuvo:

 Aplicando el teorema de Bayes se obtiene


finalmente:
Riesgo relativo
En una cierta población, considérense los
sucesos:
◦ F = Tener una cierta exposición
◦ D = Desarrollar una enfermedad
El riesgo relativo se define por:

Pr ( 𝐷∨𝐹 )
𝑅𝑅=
Pr ( 𝐷∨𝐹 )
𝐶
El tabaco como factor de riesgo del
cáncer de pulmón
Fumador
Nunca Anterior Actual
N = 83,577 N = 160,381 35,256
Incidencia 99 2,319 1,679
(x104 personas) (11.8) (144.6) (476.2)

Pr ( 𝐷∨ 𝐴𝑐𝑡𝑢𝑎𝑙 ) 476.2
𝑅𝑅= = ≈ 40.4
Pr ( 𝐷∨𝑁𝑢𝑛𝑐𝑎 ) 11.8
Riesgo relativo
Si los sucesos F y D son independientes,
entonces, RR = 1.
◦ Si D es independiente de F,
◦ Como D es también independiente de F C , también
será , y de ahí, RR = 1.
Si RR = 1, entonces F y D son independientes
Si RR = 1 entonces:

Por otro lado:

( ) ( ) |
Pr 𝐷 =Pr ( 𝐷|𝐹 ) Pr 𝐹 +Pr ( 𝐷 𝐹 ) Pr 𝐹 ) =?
𝐶
( 𝐶
Riesgo relativo
RR = 1 sii D independiente de F

RR > 1 sii F factor de riesgo de D

RR < 1 sii F factor de protección de D


Association between two events: relative risk
T2DM
Yes No
N = 128 N = 902
Arterial hypertension % 64.8 26.7
Association between two events: relative risk
Arterial hypertension
Yes No
N = 324 N = 706
T2DM, % 25.6 6.4
Association between two events: odds-ratio

A AC
B Pr(B | A ) Pr(B | AC )

BC Pr(BC | A ) Pr(BC | AC )
Odd-Ratio
T2DM
Yes No Total
AHT Yes 83 (64.8) 241 (26.7) 324
No 45 (35.2) 661 (73.3) 706
Total 128 902 1,030
Odd-Ratio
AHT
Yes No Total
T2DM Yes 83 (25.6) 45 (6.4) 128
No 241 (74.4) 661 (93.6) 902
Total 324 706 1,030
Association between two events: odds-ratio

A AC
B Pr(B | A ) Pr(B | AC )

BC Pr(BC | A ) Pr(BC | AC )

Pr ( 𝐵| 𝐴 ) × Pr ( 𝐵𝐶| 𝐴𝐶 ) Pr ( 𝐵| 𝐴 ) / Pr ( 𝐵 | 𝐴 )
𝐶
𝑂𝑅= =
Pr ( 𝐵 | 𝐴 ) × Pr ( 𝐵| 𝐴 ) Pr ( 𝐵| 𝐴 ) / Pr ( 𝐵 | 𝐴 )
𝐶 𝐶 𝐶 𝐶 𝐶
Odd-ratio
A y B son independientes sii OR = 1.
◦ Si los sucesos son independientes, es obvio
que la OR =1.
◦ Probar entonces que si OR = 1, entonces A y B
son independientes (**).
Bajo peso OR (IC 95%)
Si No
N = 59 N = 130
Edad 22.3 ± 4.5 23.7 ± 5.6
Fumadora (%) 50.8 33.8 2.022 (1.081 ; 3.783)
Irritabilidad uterina (%) 23.7 10.8 2.578 (1.139 ; 5.834)
Hipertensión arterial (%) 11.9 3.8 3.365 (1.021 ; 11.09)
Raza (%)
Blanca 39.0 56.2 1
Negra 18.6 11.5 2.328 (0.939 ; 5.772)
Otra 42.4 32.3 1.889 (0.935 ; 3.736)
Peso último periodo 55.4 ± 12.0 60.5 ± 14.4
Nº controles embarazo
Ninguno 61.0 49.2
Uno 18.6 27.7
Dos ó más 20.3 23.1
Trabajos prematuros (%) 30.5 9.2 4.317 (1.916 ; 9.726)
Asociación tabaco con bajo peso al
nacimiento
Bajo peso al nacimiento

Si No
N = 59 N = 130
Madre Si 30 (50.8) 44 (33.8)
fumadora No 29 (49.2) 86 (66.2)

D= Bajo peso al nacimiento Pr (F | D) = 0.508


F = Madre fumadora Pr (F | D C ) = 0.338
Asociación tabaco con bajo peso al nacimiento

Bajo peso al nacimiento

Si No
N = 59 N = 130
Madre Si 30 (50.8) 44 (33.8)
fumadora No 29 (49.2) 86 (66.2)

D= Bajo peso al nacimiento Pr (F | D) = 0.508


F = Madre fumadora Pr (F | D C ) = 0.338

Pr(D|F) =30/74 = 0.405 (40.5%)


Asociación tabaco con bajo peso al nacimiento

Bajo peso al nacimiento

Si No
N = 590 N = 130
Madre Si 300 (50.8) 44 (33.8)
fumadora No 290 (49.2) 86 (66.2)

D= Bajo peso al nacimiento Pr (F | D) = 0.508


F = Madre fumadora Pr (F | D C ) = 0.338

Pr(D|F) = 300/344 = 0.872 (87.2%)


Riesgo relativo en estudios de caso-
control
 En los estudios de caso control pueden obtenerse las
probabilidades: Pr( F | D ) y Pr( F | DC ).
 Supóngase que además se conoce Pr(D).
 Nótese que los sucesos {D, DC } forman un sistema
completo. De esta forma, de acuerdo con la fórmula
de Bayes, puede escribirse:

 Análogamente se obtendría Pr( D | F C ), y de ahí, el


RR = Pr( D | F )/Pr( D | F C )
Diagnóstico clínico
 Considérese en una cierta población una enfermedad D
(presente = D ; ausente = DC ).
 Para su diagnóstico se dispone de un test o prueba
diagnóstica T (positivo = T ; negativo = T C ).
 Al aplicarse la prueba pueden darse los siguientes
escenarios:

D DC
T Verdadero Falso positivo
positivo
TC Falso negativo Verdadero negativo
Diagnóstico clínico
Sensibilidad = Pr( T | D)
Especificidad = Pr( T C | D C )
Coeficiente falso positivo = Pr(T | D C )
Coeficiente falso negativo = Pr(T C | D)
Valor predictivo positivo = Pr(D | T )
Valor predictivo negativo = Pr(DC | TC )
Nótese que:
◦ Sensibilidad + Coeficiente falso negativo = 1.
◦ Especificidad + Coeficiente falso positivo = 1.
Diagnóstico clínico
Sensibilidad + Coeficiente falso negativo =1

En efecto:
El antígeno prostático específico como marcador
del cáncer de próstata
El antígeno prostático específico (PSA) se utiliza
frecuentemente como prueba de screening para la
detección precoz del cáncer de próstata.
Smith DS et al llevaron a cabo un estudio en el que se
realizó biopsia de próstata a 2411 varones de raza
blanca resultando que 580 tenían cáncer de próstata.
Se realizó asimismo la determinación del PSA y se
consideró de riesgo cuando su valor fue superior a 4
ng/ml.
Superaron este umbral 1298 sujetos de los cuales 443
tenían realmente cáncer de próstata.
Evaluar la prueba diagnóstica.
El antígeno prostático específico como marcador
del cáncer de próstata

D = Cáncer de próstata

T = PSA > 4 ng/ml

D DC

T 443 855 1298

TC 137 976 1113

580 1831 2411


El antígeno prostático específico como marcador
del cáncer de próstata
Disease + Disease - Total
Test + 443 855 1298
Test - 137 976 1113
Total 580 1831 2411

Point estimates and 95 % CIs:


--------------------------------------------------------
-
Sensitivity 0.76 (0.73, 0.80)
Specificity 0.53 (0.51, 0.56)
Positive predictive value 0.34 (0.32, 0.37)
Negative predictive value 0.88 (0.86, 0.90)
Positive likelihood ratio 1.64 (1.53, 1.75)
Negative likelihood ratio 0.44 (0.38, 0.52)
--------------------------------------------------------
-
Valores predictivos obtenidos a partir de la
sensibilidad, especificidad y prevalencia de la
enfermedad
 Supóngase que de una prueba diagnóstica se conoce su
sensibilidad (Pr(T |D)) y especificidad (Pr(T C | D C )).
 Si además se conoce la prevalencia de la enfermedad
(Pr(D)) en una cierta población, pueden obtenerse los
valores predictivos mediante la fórmula de Bayes.
 Nótese que los sucesos {D, DC} forman un sistema
completo. De esta forma:
Diagnostic value of alpha-fetoprotein combined with
neutrophil-to-lymphocyte ratio for hepatocellular carcinoma

 Liver cancer is the sixth most common cancer and the third leading cause
of cancer-related death worldwide.

 Hepatocellular carcinoma (HCC), which accounts for 70–85% of liver


cancer cases, is always diagnosed in an advanced stage and is associated
with a poor prognosis, with a 5-year overall survival rate of less than 15%.

 Alpha-fetoprotein (AFP) is the most widely used serum marker for


screening and initial diagnosis of HCC in clinical practice among people
with liver disease.

 However, the sensitivity of AFP is only 57.7% at a cut-off value of 20


ng/mL, and the specificity is 85.2%.

 Calculate its predictive values in a population of people with liver disease


in which the prevalence of HCC is 20%.
Diagnostic value of alpha-fetoprotein combined with
neutrophil-to-lymphocyte ratio for hepatocellular carcinoma
 Population of study: People with liver disease, from
which 20% are HCC
 D = HCC ; T = Alpha-fetoprotein > 20 ng/mL
 Sensitivity =
 Specificity =
 Prevalence of HCC =
Diagnóstico de la enfermedad de Parkinson
idiopática
Elaumento de la ecogenicidad de la sustancia negra, según lo determinado
por ecografía transcraneal (TCS), es característico de la enfermedad de
Parkinson idiopática (iPD).
Los resultados de los estudios retrospectivos iniciales indican que este
signo de ultrasonido es específico para las iPD y puede ayudar a
diferenciarla de síndromes parkinsonianos atípicos (aPS).
Gaenslen et al (2008) realizaron un estudio prospectivo para evaluar la
capacidad diagnóstica de la TCS en 60 personas que presentaban
síndromes parkinsonianos precoces.
Todas las personas fueron evaluadas por la TCS en el momento en el que
fueron incluidas en el estudio.
A los 12 meses se estableció para 43 de estas personas un diagnóstico
definitivo de iPD y se descartó para las 17 restantes.
De las 43 personas con iPD, 39 habían sido positivas para la TCS mientras
que de las 17 que no tuvieron iPD, sólo 3 habían resultado positivas.
Evaluar la TCS como prueba diagnóstica para la iPD.
Razones de verosimilitudes
Razón de verosimilitud positiva (likelihood ratio)

Razón de verosimilitud negativa


El alelo e-4 de la APO-E como factor de riesgo de
la enfermedad de Alzheimer
 Seshadri et al (1995) llevaron a efecto un meta-análisis en
el que se incluyeron ocho estudios de caso-control, siendo
el objetivo común analizar la asociación entre el alelo e-4
de la apolipoproteína E y la enfermedad de Alzheimer
(AD).
 El estudio concluyó que en los pacientes con AD, la
presencia del alelo e-4 era del 56%, mientras que en los
controles era del 24%.
 Los autores estimaron que en la población general, la
probabilidad de desarrollar la AD a los 65 años es del 15%.
 Hallar el riesgo relativo de padecer la AD a la referida edad
según presencia o ausencia del alelo e-4 .

También podría gustarte