0% encontró este documento útil (0 votos)
59 vistas27 páginas

Probabilidad en Bioestadística y Salud

Este documento presenta conceptos básicos de probabilidad y su aplicación en ciencias de la salud. En 3 oraciones: 1) Define probabilidad como la proporción de resultados favorables entre todos los posibles resultados de un experimento aleatorio. 2) Explica las nociones de probabilidad frecuentista y subjetiva y presenta reglas básicas de cálculo de probabilidades. 3) Introduce el concepto de pruebas diagnósticas y cómo se pueden usar medidas como sensibilidad y especificidad para mejorar la estimación de probabilidades sobre el estado de salud de un individ
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
59 vistas27 páginas

Probabilidad en Bioestadística y Salud

Este documento presenta conceptos básicos de probabilidad y su aplicación en ciencias de la salud. En 3 oraciones: 1) Define probabilidad como la proporción de resultados favorables entre todos los posibles resultados de un experimento aleatorio. 2) Explica las nociones de probabilidad frecuentista y subjetiva y presenta reglas básicas de cálculo de probabilidades. 3) Introduce el concepto de pruebas diagnósticas y cómo se pueden usar medidas como sensibilidad y especificidad para mejorar la estimación de probabilidades sobre el estado de salud de un individ
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

25/06/2023

PROBABILIDAD

BIOESTADISTICA I

Facultad de Ciencias de la Salud/Escuela de Salud Pública/ Especialización de


Epidemiologia/Maestría en Epidemiología

¿Cuál es la probabilidad de aprobar Bioestadística?

Todos los días nos hacemos preguntas sobre probabilidad e


incluso los que han visto poco de la materia en cursos anteriores,
tienes una idea intuitiva lo suficientemente correcta para lo que
necesitamos de ella en este curso.

En este tema vamos a:


Recordar qué entendemos por probabilidad.
Recordar algunas reglas de cálculo.
Ver cómo aparecen las probabilidades en Ciencias de la Salud.
Aplicarlo a algunos conceptos nuevos de interés en C. Salud.
Pruebas diagnósticas.

2
25/06/2023

DEFINICION DE
PROBABILIDAD
Si un evento puede ocurrir de N formas, las cuales se excluyen
mutuamente y son igualmente probables, y si m de estos eventos
poseen una característica E, la probabilidad de ocurrencia de E es igual
m/N

Se lee P(E) como “La probabilidad de E”. Esta


definición se expresa como:
P (E) = m/N

4
25/06/2023

Nociones de probabilidad

Hay dos maneras principales de entender la probabilidad:

Frecuentista (objetiva): Probabilidad de un suceso es la frecuencia relativa (%) de


veces que ocurriría el suceso al realizar un experimento repetidas veces. La
probabilidad depende de la repetibilidad de algunos procesos.

Subjetiva (bayesiana): Grado de certeza que se posee sobre un suceso. Es


personal. Mide la confianza que un individuo tiene en la certeza de una
proposición determinada.

En ambos tipos de definiciones aparece el concepto de suceso.


Vamos a recordar qué son y algunas operaciones que se pueden
realizar con sucesos.

Sucesos E espacio muestral


Cuando se realiza un experimento aleatorio diversos resultados son posibles.
El conjunto de todos los resultados posibles se llama espacio muestral (E).

Se llama suceso a un subconjunto de dichos resultados.

Se llama suceso contrario (complementario) de un suceso A, A’, al formado E espacio muestral


por los elementos que no están en A
A
Se llama suceso unión de A y B, AUB, al formado por los resultados A’
experimentales que están en A o en B (incluyendo los que están en ambos.

Se llama suceso intersección de A y B, A∩B o simplemente AB, al formado por


los resultados experimentales que están simultáneamente en A y B

E espacio muestral E espacio muestral E espacio muestral


UNIÓN INTERSEC.
A A A

B B B

6
25/06/2023

Definición de probabilidad y prob.


condicionada
Se llama probabilidad a cualquier función, P, que asigna a cada suceso A un valor
numérico P(A), verificando las siguientes reglas (axiomas)

0≤P(A) ≤1 E espacio muestral


E espacio muestral
100% A
P(E)=1

Se llama probabilidad de A condicionada a B, o probabilidad de A


sabiendo que pasa B:
E espacio muestral

P( A  B ) A
P( A | B) 
P ( B) B

Cualquier problema de probabilidad puede resolverse en teoría mediante aplicación


de los axiomas. Sin embargo, es más cómodo conocer algunas reglas de cálculo:

P(A’) = 1 - P(A)

P(AUB) = P(A) + P(B) - P(AB)

P(AB) = P(A) P(B|A)=P(B) P(A|B)

Prob. de que pasen A y B es la prob. de A y que también pase B sabiendo que pasó A.

Dos sucesos son independientes si la el que ocurra uno no añade información sobre el
otro. En lenguaje probabilístico:

A indep. B  P(A|B) = P(A)

Dicho de otra forma:


A indep. B  P(AB) = P(B) x P(A)

8
25/06/2023

EJEMPLO: En una muestra de 1000 individuos elegidos al azar, entre una


población de enfermos de osteoporosis 760 eran mujeres.
¿Qué porcentaje de mujeres hay en la muestra?
760/1000=0.76=76%
•Si elegimos a un individuo de la población, qué probabilidad hay de que sea
mujer:
La noc. frec. de prob. nos permite aproximarlo a P(Mujer)=0.76
•¿Cuál es la probabilidad de que elegido un individuo de la población sea hombre:

P(Hombre)=P(Mujer’)=1-0.76=0.24
•Se sabe de otros estudios que entre los individuos con osteoporosis, aprox. la
cuarta parte de las mujeres fuman y la tercera parte de los hombres. Elegimos a
un individuo al azar de la población de enfermos.
•¿Qué probabilidad hay de que sea mujer y fumadora?
P(Fumar ∩ Mujer) = P(Mujer) P(Fumar|Mujer) = 0.76 x ¼ =0.19
¿Qué probabilidad hay de que sea un hombre fumador?
P(Fumar ∩ Hombre)= P(Hombre) P(Fumar|Hombre) = 0.24 x 1/3 = 0.08

Ejemplo: En este aula el 62% de los alumnos son mujeres.


De ellas el 10% son fumadoras. De los hombres, son
fumadores el 20%.
¿Qué porcentaje de fumadores hay en total?
P(F) = P(F ∩ M) + P(F ∩ H)

= P(M) P(F|M) + P(H) P(F|H)

T. Prob. Total.
= 0.62 x 0,1 + 0.38 x 0,2 Hombres y mujeres forman
Un Sist. Exh. Excl.
= 0,138 =13.89% De sucesos
¿Se elije a un individuo al azar y resulta
fumador. ¿Cuál es la probabilidad de que sea un hombre?
P(Hom|Fum) = P(F ∩ H)/P(F) (La probabilidad de ser Hombre esta condicionada
por la condición de Fumar)

= P(F|H) P(H) / P(F) Hombres


T. Bayes Mujeres 62% 38%
= 0.2 x 0.38/ 0.138
= 0.5507 = 55,07% Fumadores

10
25/06/2023

Expresión del problema en forma de árbol

Fuma P(F) = 0,62 x 0,1 + 0,38x0,2


0,1

0,62 Mujer P(H | F) =[0,38x0,2]/P(F)


0,9
No fuma
Estudiante •Los caminos a través de nodos
representan intersecciones.
0,38 0,2
Fuma •Las bifurcaciones representan
Hombre
uniones disjuntas.

0,8 •Puede resolver los problemas


No fuma usando la técnica de su
preferencia.

11

Pruebas diagnósticas
Una prueba diagnóstica sirve para ayudar a mejorar una estimación de la probabilidad
de que un individuo presente una enfermedad.

En pricipio tenemos una idea subjetiva de P(Enfermo). Nos ayudamos de…


Incidencia,
Porcentaje de nuevos casos de la enfermedad en la población.
Prevalencia,…
Porcentaje de la población que presenta una enfermedad.
Por otra parte, para confirmar, usamos una prueba diagnóstica. La misma ha sido
evaluada con anterioridad sobre dos grupos de individuos: sanos y enfermos. Así de
modo frecuentista se ha estimado:
Sensibilidad (verdaderos +)= Capacidad que tiene la prueba de clasificar personas
como positivas en poblaciones de verdaderamente enfermos.
Especificidad (verdaderos -)= Capacidad que tiene la prueba de clasificar personas
como negativas en poblaciones de verdaderamente sanos.

A partir de lo anterior y usando el teorema de Bayes, podemos calcular las


probabilidades a posteriori (en función de los resultados del test): Índices predictivos
P(Enfermo | Test +) = Índice predictivo positivo
P(Sano | Test -) = Índice predictivo negativo

12
25/06/2023

Ejemplo: Pruebas diagnóstica y T. Bayes


La diabetes afecta al 20% de los individuos que acuden a una
consulta. La presencia de glucosuria se usa como indicador de
diabetes. Su sensibilidad es de 0,3 y la especificidad de 0,99.
Calcular los índices predictivos.

P( Enf  T )
0,3 P ( Enf | T ) 
T+ P( Enf  T )  P( Sano T )
0,2 Enfermo 0,2  0,3
  0,88
0,7 T- 0,2  0,3  0,8  0,01
Individuo
0,01 P( Sano T )
0,8 T+ P( Sano | T ) 
Sano P( Sano T )  P( Enf  T )
0,8  0,99
0,99 T-   0,85
0,8  0,99  0,2  0,7

13

Pruebas diagnósticas: aplicación T.


Bayes.
Sensibilidad, T+
verdaderos +
P. a priori de enfermedad: incid.,
preval., intuición,… Enfermo
T-
Falsos Negativos (FN o F-)
Individuo
Falsos Positivos (FP o F+)
T+
Sano

Especificidad, T-
Verdaderos -

14

14
25/06/2023

Ejemplo: Pruebas diagnóstica y T. Bayes


La prevalencia de infección por VIH es del 0.7% en población Colombiana entre 15 a 49
años (resultados del VI estudio nacional centinela VIH-SIDA de 2008). Oraquick es una prueba de tamizaje
para el Diagnóstico de infección por VIH con Sensibilidad del 0.966 y Especificidad 0.999.
Calcular los índices predictivos.
P ( Enf  T )
P ( Enf | T  ) 
P( Enf  T )  P ( Sano T )
0,966
T+ 0,007  0,966
0,007Enfermo   0,872
0,007  0,966  0,993  0,001
0,004 T-
Individuo P( Sano T )
P( Sano | T ) 
0,993 0,001 T+ P( Sano T )  P ( Enf  T )
Sano 0,993  0,999
  0,999
0,999 T- 0,993  0,999  0,007  0,004

15

Observaciones -¿Qué probabilidad tengo


de estar enfermo?

- En principio un 20%. Le
haremos unas pruebas.

En el ejemplo anterior, al llegar un individuo a la


consulta tenemos una idea a priori sobre la
probabilidad de que tenga una enfermedad.
A continuación se le pasa una prueba diagnóstica
que nos aportará nueva información: Presenta
glucosuria o no.
En función del resultado tenemos una nueva idea
(a posteriori) sobre la probabilidad de que esté
- Presenta glucosuria. La
enfermo.
probabilidad ahora es del
Nuestra opinión a priori ha sido modificada por 88%.
el resultado de un experimento.
Relaciónalo con el método científico.

16
25/06/2023

¿Qué hemos visto?


Álgebra de sucesos
Unión, intersección, complemento
Probabilidad
Nociones
Frecuentista
Subjetiva o Bayesiana
Axiomas
Probabilidad condicionada
Reglas de cálculo
Complementario, Unión, Intersección
Independencia de sucesos
Sistema exhaustivo y excluyente de sucesos
Teorema probabilidad total.
Teorema de Bayes
Pruebas diagnósticas
A priori: Incidencia, prevalencia.
Eficacia de la prueba: Sensibilidad, especificidad.
A posteriori: Índices predictivos.

17

DISTRIBUCION DE
PROBABILIDAD
Variables Aleatorias Discretas

Distribución Binomial
Distribución de Poisson

18

18
25/06/2023

Algunos modelos de variables aleatorias

Hay v.a. que aparecen con frecuencia en las Ciencias de la Salud.


Experimentos dicotómicos.
Bernoulli

Contar éxitos en experimentos dicotómicos repetidos:


• Binomial
• Poisson (sucesos raros)

Y en otras muchas ocasiones…


Distribución normal (gaussiana, campana,…)

El resto del tema está dedicado a estudiar estas distribuciones especiales.

19

Distribución de Bernoulli
Tenemos un experimento de Bernoulli si al realizar un experimentos sólo son
posibles dos resultados:
X=1 (éxito, con probabilidad p)
X=0 (fracaso, con probabilidad q=1-p)
Lanzar una moneda y que salga cara.
p=1/2
Elegir una persona de la población y que esté enfermo.
p=1/1000 = prevalencia de la enfermedad
Aplicar un tratamiento a un enfermo y que éste se cure.
p=95%, probabilidad de que el individuo se cure

Como se aprecia, en experimentos donde el resultado es dicotómico, la variable


queda perfectamente determinada conociendo el parámetro p.

20
25/06/2023

DISTRIBUCIÓN BINOMIAL

21

21

Distribución binomial
Función de probabilidad  n
P[ X  k ]    p k q n  k , 0  k  n
k 

Problemas de cálculo si n es grande y/o p cercano a 0 o 1.

Media: μ =n p

Varianza: σ2 = n p q

22
25/06/2023

Distribución Binomial
Si se repite un número fijo de veces, n, un experimento de Bernoulli con parámetro
p, el número de éxitos sigue una distribución binomial de parámetros (n,p).

Lanzar una moneda 10 veces y contar las caras.


Bin(n=10,p=1/2)

Lanzar una moneda 100 veces y contar las caras.


Bin(n=100,p=1/2)
Difícil hacer cálculos con esas cantidades. El modelo normal será más
adecuado.

El número de personas que enfermará (en una población de 500.000


personas) de una enfermedad que desarrolla una de cada 2000 personas.
Bin(n=500.000, p=1/2000)
Difícil hacer cálculos con esas cantidades. El modelo de Poisson
será más adecuado.

23

Ejercicios

24
25/06/2023

5o

25

DISTRIBUCIÓN DE
POISSON

26

26
25/06/2023

DISTRIBUCIÓN DE POISSON
 k
P[ X  k ]  e , k  0,1,2,...
k!
También se denomina de sucesos raros.
Se obtiene como aproximación de una distribución binomial con la misma media,
para ‘n grande’ (n>30) y ‘p pequeño’ (p<0,1).
Queda caracterizada por un único parámetro μ () (que es a su vez su media y
varianza.)
Función de probabilidad:

27

Ejemplos de variables de Poisson


El número de individuos que será atendido un día cualquiera en el servicio de
urgencias del hospital universitario del Valle.
En Cali hay 2.400.000 habitantes (n grande)
La probabilidad de que cualquier persona tenga un accidente es pequeña, pero no nula.
Supongamos que es 1/100.000
Bin(n=2.400.000,p=1/100.000) ≈ Poisson(μ=np=24)

Sospechamos que diferentes hospitales pueden tener servicios de


traumatología de diferente “calidad” (algunos presentan pocos, pero creemos
que aún demasiados, enfermos con secuelas tras la intervención). Es dificil
compararlos pues cada hospital atiende poblaciones de tamaños diferentes
(ciudades, pueblos,…)
Tenemos en cada hospital n, nº de pacientes atendidos o nº individuos de la población
que cubre el hospital.
Tenemos p pequeño calculado como frecuencia relativa de secuelas con respecto al
total de pacientes que trata el hospital, o el tamaño de la población,…
Se puede modelar mediante Poisson(μ=np)

28
25/06/2023

29

30
25/06/2023

31

CURVA NORMAL
Estandarización
Cálculos
Interpretación

32
25/06/2023

Función de densidad
Variables continuas
Definición
Es una función no negativa
la generalización del histograma con
frecuencias relativas para variables
continuas.
Muchos procesos aleatorios vienen descritos
por variables de forma que son conocidas
las probabilidades en intervalos.
Identificamos la probabilidad de un intervalo
con el área bajo la función de densidad.

33

Características de las funciones de


Distribución de Probabilidades

Una distribución de probabilidad permite, para cada valor o intervalo, calcular la respectiva
probabilidad.
El cálculo de la probabilidad se puede hacer a través de una fórmula, una tabla o una gráfica.
La distribución de probabilidad puede ser discreta o continua.
En distribuciones continuas, probabilidad es sinónimo de área
Para el caso de distribuciones continuas, el área bajo de curva densidad de probabilidad es 1.
Dentro de las distribuciones de probabilidad continua, se tiene la distribución normal, la cual es
quizá la más importante dentro de las distribuciones.

34
25/06/2023

LA DISTRIBUCIÓN NORMAL

Porqué es importante estudiarla?


Muchos fenómenos naturales se distribuyen normalmente.
Otras variables no precisamente normales pueden ser razonablemente aproximadas a través de
la distribución normal
Muchos tests estadísticos tienen como supuesto básico que los datos provienen de una
distribución normal.
Para cualquier distribución, si reunimos gran número de muestras de tamaño razonable, la
distribución de los promedios de tales muestras estará normalmente distribuida
Es decir… que no es necesario que los datos provengan de una población normal para que
sus promedios si lo estén

35

Características de la curva normal

Forma acampanada y simétrica


Está determinada por la media y la desviación estándar.
Aunque hay infinitas combinaciones de media y desviación estándar y por tanto infinitas curvas
normales, todas ellas se pueden transformar a una misma escala (z)
Z es una medida de qué tan lejos se encuentra un valor de la media expresado en unidades de
desviación estándar.

36
25/06/2023

Valores normalizados
tipificados
Cada curva normal está caracterizada por su media y su desviación estándar. Por tanto hay tantas
curvas normales como parejas (promedio, desviación estándar)
Todas las normales se pueden transformar en una normal especial “normal estándar”
Las unidades de esta curva Z son “desviaciones estándar”

37

Cálculo de z
Estandarización
La expresión para calcular z está dada por:

x
z

x: es el valor de la variable sobre el que se
presenta algún interés.
: promedio poblacional
: desviación estándar poblacional
Z: número de desviaciones estándar a las que
se encuentra x de la media 

38
25/06/2023

Características de la curva
normal estándar
La media, mediana y moda tienen el mismo valor
La curva es simétrica respecto a la media (sesgo es 0)
La curva tiene apuntamiento suave (mesocúrtica) curtosis =0
El área total (o probabilidad) bajo la curva es 1

39

LECTURA TABLA DE LA NORMAL

 Interpretación

Docente: Rodolfo Herrera M.

40
25/06/2023

95.44%

41

AREA BAJO LA CURVA


NORMAL ESTANDAR
Organizando para una tabla completa y con z a la izquierda

Área bajo la curva


Región = Probabilidad

PROBABILIDAD ( Z  valor especifico de z) = área bajo la curva

42
25/06/2023

AREA BAJO LA CURVA NORMAL ESTANDAR

Organizando para una tabla completa y con z a la izquierda

PROBABILIDAD ( Z ≤ 1.96) = área bajo la curva

43

Ejercicios resueltos…

44
25/06/2023

Cual es la probabilidad de obtener un valor z


entre -1 y 1?

Pr(-1 ≤ z ≤ 1) = Pr(z ≤ 1) - Pr(z ≤ -1)


= 0.84134 – 0.15866
= 0.68268

45

46
25/06/2023

Cual es la probabilidad de obtener un


valor z de al menos 1.58?

Pr(z ≥ 1.58) = 1 - Pr(z ≤ 1.58)


= 1 – 0.94295
= 0.05705
Otra forma de calcular

Pr(z ≥ 1.58) = Pr(z ≤ -1.58)

Que propiedad de la curva se utilizó


aquí?

47

= 1 – 0.94295 = 0.05705

48
25/06/2023

Cual es la probabilidad de obtener un valor


z de -0.5 ó más?

Pr(z ≥ -0.5) = 1- Pr(z ≤ -0.5)

= 1 - 0.30854

= 0.69146

49

50
25/06/2023

Encuentre un valor z tal que la probabilidad por debajo de 0.9

Pr(z ≤ ? ) = 0.9
Encontrar en la tabla el valor de Z asociado a una probabilidad
de 0.9
Se encuentra que 0.89973 ~ 0.9 (área entre -∞ y 1.28), por
tanto,

Z = 1.28

51

Probabilidad del
area solicitada=
0.90

Cual es este valor de


z?

52
25/06/2023

Los valores de colesterol total para cierta población están


normalmente distribuidos con media 200 (mg/100 mL) y una
desviación estándar de 20 (mg/100 mL).

Cuál es la probabilidad de que una persona de esta población


tenga un valor de colesterol mayor a 240 (mg/mL)?

Pr(x ≥ 240) Se debe normalizar

= Pr(x – 200 ≥ 240 - 200 )


20 20

= Pr(z ≥ 2)
= Pr(z ≤ -2)

= 0.02275 ó 2.28%

53

También podría gustarte