25/06/2023
PROBABILIDAD
BIOESTADISTICA I
Facultad de Ciencias de la Salud/Escuela de Salud Pública/ Especialización de
Epidemiologia/Maestría en Epidemiología
¿Cuál es la probabilidad de aprobar Bioestadística?
Todos los días nos hacemos preguntas sobre probabilidad e
incluso los que han visto poco de la materia en cursos anteriores,
tienes una idea intuitiva lo suficientemente correcta para lo que
necesitamos de ella en este curso.
En este tema vamos a:
Recordar qué entendemos por probabilidad.
Recordar algunas reglas de cálculo.
Ver cómo aparecen las probabilidades en Ciencias de la Salud.
Aplicarlo a algunos conceptos nuevos de interés en C. Salud.
Pruebas diagnósticas.
2
25/06/2023
DEFINICION DE
PROBABILIDAD
Si un evento puede ocurrir de N formas, las cuales se excluyen
mutuamente y son igualmente probables, y si m de estos eventos
poseen una característica E, la probabilidad de ocurrencia de E es igual
m/N
Se lee P(E) como “La probabilidad de E”. Esta
definición se expresa como:
P (E) = m/N
4
25/06/2023
Nociones de probabilidad
Hay dos maneras principales de entender la probabilidad:
Frecuentista (objetiva): Probabilidad de un suceso es la frecuencia relativa (%) de
veces que ocurriría el suceso al realizar un experimento repetidas veces. La
probabilidad depende de la repetibilidad de algunos procesos.
Subjetiva (bayesiana): Grado de certeza que se posee sobre un suceso. Es
personal. Mide la confianza que un individuo tiene en la certeza de una
proposición determinada.
En ambos tipos de definiciones aparece el concepto de suceso.
Vamos a recordar qué son y algunas operaciones que se pueden
realizar con sucesos.
Sucesos E espacio muestral
Cuando se realiza un experimento aleatorio diversos resultados son posibles.
El conjunto de todos los resultados posibles se llama espacio muestral (E).
Se llama suceso a un subconjunto de dichos resultados.
Se llama suceso contrario (complementario) de un suceso A, A’, al formado E espacio muestral
por los elementos que no están en A
A
Se llama suceso unión de A y B, AUB, al formado por los resultados A’
experimentales que están en A o en B (incluyendo los que están en ambos.
Se llama suceso intersección de A y B, A∩B o simplemente AB, al formado por
los resultados experimentales que están simultáneamente en A y B
E espacio muestral E espacio muestral E espacio muestral
UNIÓN INTERSEC.
A A A
B B B
6
25/06/2023
Definición de probabilidad y prob.
condicionada
Se llama probabilidad a cualquier función, P, que asigna a cada suceso A un valor
numérico P(A), verificando las siguientes reglas (axiomas)
0≤P(A) ≤1 E espacio muestral
E espacio muestral
100% A
P(E)=1
Se llama probabilidad de A condicionada a B, o probabilidad de A
sabiendo que pasa B:
E espacio muestral
P( A B ) A
P( A | B)
P ( B) B
Cualquier problema de probabilidad puede resolverse en teoría mediante aplicación
de los axiomas. Sin embargo, es más cómodo conocer algunas reglas de cálculo:
P(A’) = 1 - P(A)
P(AUB) = P(A) + P(B) - P(AB)
P(AB) = P(A) P(B|A)=P(B) P(A|B)
Prob. de que pasen A y B es la prob. de A y que también pase B sabiendo que pasó A.
Dos sucesos son independientes si la el que ocurra uno no añade información sobre el
otro. En lenguaje probabilístico:
A indep. B P(A|B) = P(A)
Dicho de otra forma:
A indep. B P(AB) = P(B) x P(A)
8
25/06/2023
EJEMPLO: En una muestra de 1000 individuos elegidos al azar, entre una
población de enfermos de osteoporosis 760 eran mujeres.
¿Qué porcentaje de mujeres hay en la muestra?
760/1000=0.76=76%
•Si elegimos a un individuo de la población, qué probabilidad hay de que sea
mujer:
La noc. frec. de prob. nos permite aproximarlo a P(Mujer)=0.76
•¿Cuál es la probabilidad de que elegido un individuo de la población sea hombre:
P(Hombre)=P(Mujer’)=1-0.76=0.24
•Se sabe de otros estudios que entre los individuos con osteoporosis, aprox. la
cuarta parte de las mujeres fuman y la tercera parte de los hombres. Elegimos a
un individuo al azar de la población de enfermos.
•¿Qué probabilidad hay de que sea mujer y fumadora?
P(Fumar ∩ Mujer) = P(Mujer) P(Fumar|Mujer) = 0.76 x ¼ =0.19
¿Qué probabilidad hay de que sea un hombre fumador?
P(Fumar ∩ Hombre)= P(Hombre) P(Fumar|Hombre) = 0.24 x 1/3 = 0.08
Ejemplo: En este aula el 62% de los alumnos son mujeres.
De ellas el 10% son fumadoras. De los hombres, son
fumadores el 20%.
¿Qué porcentaje de fumadores hay en total?
P(F) = P(F ∩ M) + P(F ∩ H)
= P(M) P(F|M) + P(H) P(F|H)
T. Prob. Total.
= 0.62 x 0,1 + 0.38 x 0,2 Hombres y mujeres forman
Un Sist. Exh. Excl.
= 0,138 =13.89% De sucesos
¿Se elije a un individuo al azar y resulta
fumador. ¿Cuál es la probabilidad de que sea un hombre?
P(Hom|Fum) = P(F ∩ H)/P(F) (La probabilidad de ser Hombre esta condicionada
por la condición de Fumar)
= P(F|H) P(H) / P(F) Hombres
T. Bayes Mujeres 62% 38%
= 0.2 x 0.38/ 0.138
= 0.5507 = 55,07% Fumadores
10
25/06/2023
Expresión del problema en forma de árbol
Fuma P(F) = 0,62 x 0,1 + 0,38x0,2
0,1
0,62 Mujer P(H | F) =[0,38x0,2]/P(F)
0,9
No fuma
Estudiante •Los caminos a través de nodos
representan intersecciones.
0,38 0,2
Fuma •Las bifurcaciones representan
Hombre
uniones disjuntas.
0,8 •Puede resolver los problemas
No fuma usando la técnica de su
preferencia.
11
Pruebas diagnósticas
Una prueba diagnóstica sirve para ayudar a mejorar una estimación de la probabilidad
de que un individuo presente una enfermedad.
En pricipio tenemos una idea subjetiva de P(Enfermo). Nos ayudamos de…
Incidencia,
Porcentaje de nuevos casos de la enfermedad en la población.
Prevalencia,…
Porcentaje de la población que presenta una enfermedad.
Por otra parte, para confirmar, usamos una prueba diagnóstica. La misma ha sido
evaluada con anterioridad sobre dos grupos de individuos: sanos y enfermos. Así de
modo frecuentista se ha estimado:
Sensibilidad (verdaderos +)= Capacidad que tiene la prueba de clasificar personas
como positivas en poblaciones de verdaderamente enfermos.
Especificidad (verdaderos -)= Capacidad que tiene la prueba de clasificar personas
como negativas en poblaciones de verdaderamente sanos.
A partir de lo anterior y usando el teorema de Bayes, podemos calcular las
probabilidades a posteriori (en función de los resultados del test): Índices predictivos
P(Enfermo | Test +) = Índice predictivo positivo
P(Sano | Test -) = Índice predictivo negativo
12
25/06/2023
Ejemplo: Pruebas diagnóstica y T. Bayes
La diabetes afecta al 20% de los individuos que acuden a una
consulta. La presencia de glucosuria se usa como indicador de
diabetes. Su sensibilidad es de 0,3 y la especificidad de 0,99.
Calcular los índices predictivos.
P( Enf T )
0,3 P ( Enf | T )
T+ P( Enf T ) P( Sano T )
0,2 Enfermo 0,2 0,3
0,88
0,7 T- 0,2 0,3 0,8 0,01
Individuo
0,01 P( Sano T )
0,8 T+ P( Sano | T )
Sano P( Sano T ) P( Enf T )
0,8 0,99
0,99 T- 0,85
0,8 0,99 0,2 0,7
13
Pruebas diagnósticas: aplicación T.
Bayes.
Sensibilidad, T+
verdaderos +
P. a priori de enfermedad: incid.,
preval., intuición,… Enfermo
T-
Falsos Negativos (FN o F-)
Individuo
Falsos Positivos (FP o F+)
T+
Sano
Especificidad, T-
Verdaderos -
14
14
25/06/2023
Ejemplo: Pruebas diagnóstica y T. Bayes
La prevalencia de infección por VIH es del 0.7% en población Colombiana entre 15 a 49
años (resultados del VI estudio nacional centinela VIH-SIDA de 2008). Oraquick es una prueba de tamizaje
para el Diagnóstico de infección por VIH con Sensibilidad del 0.966 y Especificidad 0.999.
Calcular los índices predictivos.
P ( Enf T )
P ( Enf | T )
P( Enf T ) P ( Sano T )
0,966
T+ 0,007 0,966
0,007Enfermo 0,872
0,007 0,966 0,993 0,001
0,004 T-
Individuo P( Sano T )
P( Sano | T )
0,993 0,001 T+ P( Sano T ) P ( Enf T )
Sano 0,993 0,999
0,999
0,999 T- 0,993 0,999 0,007 0,004
15
Observaciones -¿Qué probabilidad tengo
de estar enfermo?
- En principio un 20%. Le
haremos unas pruebas.
En el ejemplo anterior, al llegar un individuo a la
consulta tenemos una idea a priori sobre la
probabilidad de que tenga una enfermedad.
A continuación se le pasa una prueba diagnóstica
que nos aportará nueva información: Presenta
glucosuria o no.
En función del resultado tenemos una nueva idea
(a posteriori) sobre la probabilidad de que esté
- Presenta glucosuria. La
enfermo.
probabilidad ahora es del
Nuestra opinión a priori ha sido modificada por 88%.
el resultado de un experimento.
Relaciónalo con el método científico.
16
25/06/2023
¿Qué hemos visto?
Álgebra de sucesos
Unión, intersección, complemento
Probabilidad
Nociones
Frecuentista
Subjetiva o Bayesiana
Axiomas
Probabilidad condicionada
Reglas de cálculo
Complementario, Unión, Intersección
Independencia de sucesos
Sistema exhaustivo y excluyente de sucesos
Teorema probabilidad total.
Teorema de Bayes
Pruebas diagnósticas
A priori: Incidencia, prevalencia.
Eficacia de la prueba: Sensibilidad, especificidad.
A posteriori: Índices predictivos.
17
DISTRIBUCION DE
PROBABILIDAD
Variables Aleatorias Discretas
Distribución Binomial
Distribución de Poisson
18
18
25/06/2023
Algunos modelos de variables aleatorias
Hay v.a. que aparecen con frecuencia en las Ciencias de la Salud.
Experimentos dicotómicos.
Bernoulli
Contar éxitos en experimentos dicotómicos repetidos:
• Binomial
• Poisson (sucesos raros)
Y en otras muchas ocasiones…
Distribución normal (gaussiana, campana,…)
El resto del tema está dedicado a estudiar estas distribuciones especiales.
19
Distribución de Bernoulli
Tenemos un experimento de Bernoulli si al realizar un experimentos sólo son
posibles dos resultados:
X=1 (éxito, con probabilidad p)
X=0 (fracaso, con probabilidad q=1-p)
Lanzar una moneda y que salga cara.
p=1/2
Elegir una persona de la población y que esté enfermo.
p=1/1000 = prevalencia de la enfermedad
Aplicar un tratamiento a un enfermo y que éste se cure.
p=95%, probabilidad de que el individuo se cure
Como se aprecia, en experimentos donde el resultado es dicotómico, la variable
queda perfectamente determinada conociendo el parámetro p.
20
25/06/2023
DISTRIBUCIÓN BINOMIAL
21
21
Distribución binomial
Función de probabilidad n
P[ X k ] p k q n k , 0 k n
k
Problemas de cálculo si n es grande y/o p cercano a 0 o 1.
Media: μ =n p
Varianza: σ2 = n p q
22
25/06/2023
Distribución Binomial
Si se repite un número fijo de veces, n, un experimento de Bernoulli con parámetro
p, el número de éxitos sigue una distribución binomial de parámetros (n,p).
Lanzar una moneda 10 veces y contar las caras.
Bin(n=10,p=1/2)
Lanzar una moneda 100 veces y contar las caras.
Bin(n=100,p=1/2)
Difícil hacer cálculos con esas cantidades. El modelo normal será más
adecuado.
El número de personas que enfermará (en una población de 500.000
personas) de una enfermedad que desarrolla una de cada 2000 personas.
Bin(n=500.000, p=1/2000)
Difícil hacer cálculos con esas cantidades. El modelo de Poisson
será más adecuado.
23
Ejercicios
24
25/06/2023
5o
25
DISTRIBUCIÓN DE
POISSON
26
26
25/06/2023
DISTRIBUCIÓN DE POISSON
k
P[ X k ] e , k 0,1,2,...
k!
También se denomina de sucesos raros.
Se obtiene como aproximación de una distribución binomial con la misma media,
para ‘n grande’ (n>30) y ‘p pequeño’ (p<0,1).
Queda caracterizada por un único parámetro μ () (que es a su vez su media y
varianza.)
Función de probabilidad:
27
Ejemplos de variables de Poisson
El número de individuos que será atendido un día cualquiera en el servicio de
urgencias del hospital universitario del Valle.
En Cali hay 2.400.000 habitantes (n grande)
La probabilidad de que cualquier persona tenga un accidente es pequeña, pero no nula.
Supongamos que es 1/100.000
Bin(n=2.400.000,p=1/100.000) ≈ Poisson(μ=np=24)
Sospechamos que diferentes hospitales pueden tener servicios de
traumatología de diferente “calidad” (algunos presentan pocos, pero creemos
que aún demasiados, enfermos con secuelas tras la intervención). Es dificil
compararlos pues cada hospital atiende poblaciones de tamaños diferentes
(ciudades, pueblos,…)
Tenemos en cada hospital n, nº de pacientes atendidos o nº individuos de la población
que cubre el hospital.
Tenemos p pequeño calculado como frecuencia relativa de secuelas con respecto al
total de pacientes que trata el hospital, o el tamaño de la población,…
Se puede modelar mediante Poisson(μ=np)
28
25/06/2023
29
30
25/06/2023
31
CURVA NORMAL
Estandarización
Cálculos
Interpretación
32
25/06/2023
Función de densidad
Variables continuas
Definición
Es una función no negativa
la generalización del histograma con
frecuencias relativas para variables
continuas.
Muchos procesos aleatorios vienen descritos
por variables de forma que son conocidas
las probabilidades en intervalos.
Identificamos la probabilidad de un intervalo
con el área bajo la función de densidad.
33
Características de las funciones de
Distribución de Probabilidades
Una distribución de probabilidad permite, para cada valor o intervalo, calcular la respectiva
probabilidad.
El cálculo de la probabilidad se puede hacer a través de una fórmula, una tabla o una gráfica.
La distribución de probabilidad puede ser discreta o continua.
En distribuciones continuas, probabilidad es sinónimo de área
Para el caso de distribuciones continuas, el área bajo de curva densidad de probabilidad es 1.
Dentro de las distribuciones de probabilidad continua, se tiene la distribución normal, la cual es
quizá la más importante dentro de las distribuciones.
34
25/06/2023
LA DISTRIBUCIÓN NORMAL
Porqué es importante estudiarla?
Muchos fenómenos naturales se distribuyen normalmente.
Otras variables no precisamente normales pueden ser razonablemente aproximadas a través de
la distribución normal
Muchos tests estadísticos tienen como supuesto básico que los datos provienen de una
distribución normal.
Para cualquier distribución, si reunimos gran número de muestras de tamaño razonable, la
distribución de los promedios de tales muestras estará normalmente distribuida
Es decir… que no es necesario que los datos provengan de una población normal para que
sus promedios si lo estén
35
Características de la curva normal
Forma acampanada y simétrica
Está determinada por la media y la desviación estándar.
Aunque hay infinitas combinaciones de media y desviación estándar y por tanto infinitas curvas
normales, todas ellas se pueden transformar a una misma escala (z)
Z es una medida de qué tan lejos se encuentra un valor de la media expresado en unidades de
desviación estándar.
36
25/06/2023
Valores normalizados
tipificados
Cada curva normal está caracterizada por su media y su desviación estándar. Por tanto hay tantas
curvas normales como parejas (promedio, desviación estándar)
Todas las normales se pueden transformar en una normal especial “normal estándar”
Las unidades de esta curva Z son “desviaciones estándar”
37
Cálculo de z
Estandarización
La expresión para calcular z está dada por:
x
z
x: es el valor de la variable sobre el que se
presenta algún interés.
: promedio poblacional
: desviación estándar poblacional
Z: número de desviaciones estándar a las que
se encuentra x de la media
38
25/06/2023
Características de la curva
normal estándar
La media, mediana y moda tienen el mismo valor
La curva es simétrica respecto a la media (sesgo es 0)
La curva tiene apuntamiento suave (mesocúrtica) curtosis =0
El área total (o probabilidad) bajo la curva es 1
39
LECTURA TABLA DE LA NORMAL
Interpretación
Docente: Rodolfo Herrera M.
40
25/06/2023
95.44%
41
AREA BAJO LA CURVA
NORMAL ESTANDAR
Organizando para una tabla completa y con z a la izquierda
Área bajo la curva
Región = Probabilidad
PROBABILIDAD ( Z valor especifico de z) = área bajo la curva
42
25/06/2023
AREA BAJO LA CURVA NORMAL ESTANDAR
Organizando para una tabla completa y con z a la izquierda
PROBABILIDAD ( Z ≤ 1.96) = área bajo la curva
43
Ejercicios resueltos…
44
25/06/2023
Cual es la probabilidad de obtener un valor z
entre -1 y 1?
Pr(-1 ≤ z ≤ 1) = Pr(z ≤ 1) - Pr(z ≤ -1)
= 0.84134 – 0.15866
= 0.68268
45
46
25/06/2023
Cual es la probabilidad de obtener un
valor z de al menos 1.58?
Pr(z ≥ 1.58) = 1 - Pr(z ≤ 1.58)
= 1 – 0.94295
= 0.05705
Otra forma de calcular
Pr(z ≥ 1.58) = Pr(z ≤ -1.58)
Que propiedad de la curva se utilizó
aquí?
47
= 1 – 0.94295 = 0.05705
48
25/06/2023
Cual es la probabilidad de obtener un valor
z de -0.5 ó más?
Pr(z ≥ -0.5) = 1- Pr(z ≤ -0.5)
= 1 - 0.30854
= 0.69146
49
50
25/06/2023
Encuentre un valor z tal que la probabilidad por debajo de 0.9
Pr(z ≤ ? ) = 0.9
Encontrar en la tabla el valor de Z asociado a una probabilidad
de 0.9
Se encuentra que 0.89973 ~ 0.9 (área entre -∞ y 1.28), por
tanto,
Z = 1.28
51
Probabilidad del
area solicitada=
0.90
Cual es este valor de
z?
52
25/06/2023
Los valores de colesterol total para cierta población están
normalmente distribuidos con media 200 (mg/100 mL) y una
desviación estándar de 20 (mg/100 mL).
Cuál es la probabilidad de que una persona de esta población
tenga un valor de colesterol mayor a 240 (mg/mL)?
Pr(x ≥ 240) Se debe normalizar
= Pr(x – 200 ≥ 240 - 200 )
20 20
= Pr(z ≥ 2)
= Pr(z ≤ -2)
= 0.02275 ó 2.28%
53