Está en la página 1de 32

UNIVERSIDAD DE GUAYAQUIL

Bioestadística
FUNDAMENTOS DE
BIOESTADÍSTICA

Probabilidades
• ¿Cuál es la probabilidad de aprobar Bioestadística?

• ¿Cuál es la probabilidad de no encontrarme un atasco cuando voy a


clase?

• Todos los días nos hacemos preguntas sobre probabilidad e incluso


los que hayáis visto poco de la materia en cursos anteriores, tenéis
una idea intuitiva lo suficientemente correcta para lo que
necesitamos de ella en este curso.
Nociones de probabilidad
• Frecuentista (objetiva): Probabilidad de un suceso es la frecuencia relativa (%)
de veces que ocurriría el suceso al realizar un experimento repetidas veces.

CLASIFICACION OMS
CLASIFICACION OMS

NORMAL
Frecuencia Porcentaje
Válidos NORMAL 469 46,9% OSTEOPENIA
OSTEOPENIA 467 46,7%
OSTEOPOROSIS
OSTEOPOROSIS 64 6,4%
Total 1000 100,0 0 10 20 30 40 50
Porcentaje

• Subjetiva (bayesiana): Grado de certeza que se posee sobre un suceso. Es


personal. En ambos tipos de definiciones aparece el concepto de suceso. Vamos
a ver qué son y algunas operaciones que se pueden realizar con sucesos.

Sucesos
Cuando se realiza un experimento aleatorio diversos resultados son posibles.
E espacio muestral
El conjunto de todos los resultados posibles se llama espacio muestral (E).

• Se llama suceso a un subconjunto de dichos resultados.

• Se llama suceso contrario (complementario) de un suceso A, A’, al formado


por los elementos que no están en A E espacio muestral

A
• Se llama suceso unión de A y B, AUB, al formado por los resultados
experimentales que están en A o en B (incluyendo los que están en ambos. A’

• Se llama suceso intersección de A y B, A∩B o simplemente AB, al formado por


los elementos que están en A y B
E espacio muestral
E espacio muestral E espacio muestral
A
UNIÓN INTERS.
A A
B
B B

Tema 4: Probabilidad 4 Bioestadística. U. Málaga.


Definición de probabilidad
• Se llama probabilidad a cualquier función, P, que asigna a
cada suceso A un valor numérico P(A), verificando las
siguientes reglas (axiomas)
E espacio muestral
• P(E)=1
100%

E espacio muestral
• 0≤P(A) ≤1
A
• P(AUB)=P(A)+P(B) si A∩B=Ø B
• Ø es el conjunto vacío.

• Podéis imaginar la probabilidad de un subconjunto como el


tamaño relativo con respecto al total (suceso seguro)
Tema 4: Probabilidad 5 Bioestadística. U. Málaga.
EJEMPLOS
P(A)=3/9=1/3
P(A)=?
E espacio muestral
P(B)=5/9P(B)=?
A P(AUB)=6/9=2/3
P(AUB)=?
P(AB)=?
P(AB)=2/9 P(A)=3/9=1/3
P(A)=?
B P(A’)=?
P(A’)=6/9=2/3 E espacio muestral
P(B)=2/9P(B)=?
P(B’)=4/9
P(B’)=? A
P(AUB)=3/9=1/3
P(AUB)=?
B
P(AB)=2/9
P(AB)=?
P(A’)=?
P(A’)=6/9=2/3
E espacio muestral
P(A)=3/9=1/3
P(A)=? P(B’)=7/9
P(B’)=?
P(B)=2/9P(B)=?
A P(AUB)=5/9
P(AUB)=?
B
P(AB)=0P(AB)=?
P(A’)=6/9=2/3
P(A’)=?
P(B’)=7/9
P(B’)=?
Tema 4: Probabilidad 6 Bioestadística. U. Málaga.
Probabilidad condicionada
• Se llama probabilidad de A condicionada a B, o
probabilidad de A sabiendo que pasa B:
E espacio muestral

P(AÇ B) A
P(A | B) 
P(B) B

 Error frecuentíiiiiiisimo:
 No confundáis probabilidad condicionada con intersección.
 En ambos medimos efectivamente la intersección, pero…
 En P(A∩B) con respecto a P(E)=1
 En P(A|B) con respecto a P(B)

Tema 4: Probabilidad 7 Bioestadística. U. Málaga.


EJEMPLOS
P(A)=3/9=1/3
E espacio muestral
P(B)=5/9
A P(AUB)=6/9=2/3
P(AB)=2/9 P(A)=3/9=1/3
B P(A’)=6/9=2/3 E espacio muestral
P(B)=2/9
P(B’)=4/9 A
P(AUB)=3/9=1/3
P(A|B)=? P(B|A)=2/3
P(A|B)=2/5 P(B|A)=? P(AB)=2/9
B
P(A’)=6/9=2/3
P(A)=3/9=1/3
E espacio muestral
P(B’)=7/9
P(B)=2/9 P(A|B)=? P(B|A)=2/3
P(A|B)=1 P(B|A)=?
A P(AUB)=5/9
B
P(AB)=0
P(A’)=6/9=2/3
P(B’)=7/9
P(A|B)=? P(B|A)=0
P(A|B)=0 P(B|A)=?
Tema 4: Probabilidad 8 Bioestadística. U. Málaga.
Intuir la probabilidad condicionada
A A

B
B

P(A) = 0,25 P(A) = 0,25


P(B) = 0,10 P(B) = 0,10
P(A∩B) = 0,10 P(A∩B) = 0,08

¿Probabilidad de A sabiendo que ha pasado B?


P(A|B)=1 P(A|B)=0,8
Tema 4: Probabilidad 9 Bioestadística. U. Málaga.
Intuir la probabilidad condicionada
A A

B
B

P(A) = 0,25 P(A) = 0,25


P(B) = 0,10 P(B) = 0,10
P(A∩B) = 0,005 P(A∩B) = 0
¿Probabilidad de A sabiendo que ha pasado B?
P(A|B)=0,05 P(A|B)=0
Tema 4: Probabilidad 10 Bioestadística. U. Málaga.
Algunas reglas de cálculo prácticas
• Cualquier problema de probabilidad puede resolverse
en teoría mediante aplicación de los axiomas. Sin
embargo, es más cómodo conocer algunas reglas de
cálculo:

• P(A’) = 1 - P(A)

• P(AUB) = P(A) + P(B) - P(AB)

• P(AB) = P(A) P(B|A)

= P(B) P(A|B)

• Prob. de que pasen A y B es la prob. de A y que también pase B


sabiendo que pasó A.
Tema 4: Probabilidad 11 Bioestadística. U. Málaga.
Recuento
MENOPAUSIA
Ejemplo (I) CLASIFICACION NORMAL
NO
189
SI
280
Total
469
OMS OSTEOPENIA 108 359 467
OSTEOPOROSIS 6 58 64
Total 303 697 1000

• Se ha repetido en 1000 ocasiones el experimento de elegir a una


mujer de una población muy grande. El resultado está en la tabla.
• ¿Cuál es la probabilidad de que una mujer tenga
osteoporosis?
• P(Osteoporosis)=64/1000=0,064=6,4%
• Noción frecuentista de probabilidad
• ¿Cuál es la probabilidad de que una mujer no tenga
osteoporosis?
• P(No Osteoporosis)=1-P(Osteoporsis)=1-64/1000=0,936=93,6%

Tema 4: Probabilidad 12 Bioestadística. U. Málaga.


Recuento

Ejemplo (II) MENOPAUSIA


NO SI Total
CLASIFICACION NORMAL 189 280 469
OMS OSTEOPENIA 108 359 467
OSTEOPOROSIS 6 58 64
Total 303 697 1000
• ¿Probabilidad de tener osteopenia u osteoporosis?
• P(OsteopeniaUOsteoporosis)=P(Osteopenia)+P(Osteoporosis)-
P(Osteopenia∩Osteoporosis)=467/1000+64/1000=0,531
• Son sucesos disjuntos
• Osteopenia ∩ Osteoporosis=Ø

• ¿Probabilidad de tener osteoporosis o menopausia?


• P(OsteoporosisUMenopausia)=P(Osteoporosis)+P(Menopausia)-
P(Osteoporosis ∩ Menopausia)=64/1000+697/1000-58/1000=0,703
• No son sucesos disjuntos
• ¿Probabilidad de una mujer normal?
• P(Normal)=469/1000=0,469
• P(Normal)=1-P(Normal’)=1-P(OsteopeniaUOsteoporosis) =1-0,531=0,469
Tema 4: Probabilidad 13 Bioestadística. U. Málaga.
Recuento

Ejemplo (III) MENOPAUSIA


NO SI Total
CLASIFICACION NORMAL 189 280 469
OMS OSTEOPENIA 108 359 467
OSTEOPOROSIS 6 58 64
Total 303 697 1000

• Si es menopáusica… ¿probabilidad de osteoporosis?


• P(Osteoporosis|Menopausia)=58/697=0,098

• ¿Probabilidad de menopausia y osteoporosis?


• P(Menop ∩ Osteoporosis) = 58/1000=0,058

• Otra forma:

P( Menop  Osteoporosis )  P( Menop)  P(Osteoporosis | Menop) 


697 58
   58 / 1000  0,058
1000 697
Tema 4: Probabilidad 14 Bioestadística. U. Málaga.
SEMANA 1

Tabla de contingencia
En estadística las tablas de contingencia se
emplean para registrar y analizar la asociación
entre dos o más variables, habitualmente de
naturaleza cualitativa (nominales u ordinales).

Se sabe que la información proporcionada por una tabla


bidimensional puede expresarse en términos diversos:
frecuencias absolutas conjuntas, relativas conjuntas,
condicionadas de una variable a valores de la otra. Además
puede derivarse el comportamiento unidimensional de las
variables implicadas mediante las distribuciones marginales.

15
donde nij expresa la frecuencia
absoluta observada en las
modalidades Xi e Yj refleja la
distribución conjunta de X e Y.

La misma tabla puede expresarse en


frecuencias relativas o proporciones sin
más que dividir cada casilla nij por el total
N. ∑∑= = = k j p i i j

16
Las tablas de contingencia hemos dicho que estudia relaciones
entre dos variables cualitativas

Si queremos estudiar la relación entre el color de ojos y el color del pelo.

La variable X: Color de La variable Y: Color de


ojos pelo
x1: ojos claros y1: pelo claro
x2: ojos oscuros y2: pelo oscuro
¿Cómo construir una tabla de contingencia?

EJEMPLO. En un hospital
psiquiátrico se hace un
estudio en el que participan Variable X: Tipo de tratamiento
30 pacientes con dos tipos de x1: antiguo
problemas neuronales (altos y x2: nuevo
bajos), queremos comparar Variable Y: Problemas neuronales
y1: altos
un fármaco nuevo con otro
y2: bajos
antiguo. ¿Cómo podemos
representar esta situación?
¿Cómo podemos ver si el
tratamiento nuevo es
preferible al anterior?

18
Los pacientes nos dijeron el tipo de problema y que fármaco tomaban

Sujeto1 (alto, antiguo), Sujeto2 (alto, antiguo),


Sujeto3 (bajo, antiguo), Sujeto4 (alto, nuevo), Sujeto5 (alto, nuevo)…

Contamos cuantos hay del mismo tipo, es decir:

a = Problemas altos y tratamiento antiguo = 10


b = Problemas bajos y tratamiento antiguo = 4
c = Problemas altos y tratamiento nuevo = 5
d = Problemas bajos y tratamiento nuevo = 11
19
TABLA DE CONTINGENCIA

Tratamiento (X) Problemas neuronales (Y)


Altos (y1) Bajos (y2)
Antiguo (x1) a = 10 b=4
Nuevo (x2) c=5 d = 11

Estos 4 valores calculados llamaremos frecuencias absolutas dobles


(f), que nos dicen el número de sujetos que hay, con valores
específicos de las variables
20
FRECUENCIAS MARGINALES Y DISTRIBUCIÓN MARGINAL

En la tabla de las frecuencias absolutas dobles


anterior, añadimos una columna a la derecha y una
fila debajo, que llamaremos “TOTAL”, en ambos
casos.

La columna del TOTAL llamaremos distribución marginal de X


Cada valor llamaremos frecuencia marginal de X
La fila del TOTAL llamaremos distribución marginal de Y
Cada valor llamaremos frecuencia marginal de Y

¿Cómo se obtiene?
Sumando la fila para la distribución marginal de X
Sumando la columna para la distribución marginal
de Y
EJEMPLO
Tratamiento Problemas neuronales TOTAL
Altos Bajos
Antiguo 10 4 10+4 = 14
(f1.)
Nuevo 5 11 5+11= 16
(f2.)
TOTAL 10+5 = 15 (f.1) 4+11 = 15 (f.2) 30 (n)

El valor n, se obtiene sumando cualquier distribución


marginal, representa el número total de sujetos, que como
recordamos son 30 pacientes.
FRECUENCIAS CONDICIONALES Y DISTRIBUCIÓN CONDICIONAL

Vamos a conocer estos términos con nuestro ejemplo

Se trabaja con la tabla de frecuencias absolutas, es decir:

Tratamiento Problemas neuronales TOTAL


Altos Bajos
Antiguo 10 (f11) 4 (f12) 14 (f1.)
Nuevo 5 (f21) 11 (f22) 16 (f2.)
TOTAL 15 (f.1) 15 (f.2) 30 (n)
Calculemos una
Podemos distribución de Y
obtener la condicionada por
distribución X, esto implica
calcular:
de X La frecuencia
condicionada condicional de y1
por y1 ó y2 Podemos condicionada por
x2
obtener la La frecuencia
distribución de condicional de y2
Y condicionada condicionada por
por x1 ó x2 x2
Los datos que nos interesan son:

Tratamiento Problemas neuronales (Y) TOTAL


Altos (y1) Bajos (y2)
Nuevo (x2) 5 11 16

Las frecuencias condicionales son:

Tratamiento Problemas neuronales (Y) TOTAL


Altos (y1) Bajos (y2)
Nuevo (x2) 5/16=0,3125 11/16=0,6875 1
(h(y1/x2)) (h(y2/x2))
La interpretación

Tratamiento Problemas neuronales (Y) TOTAL


Altos (y1) Bajos (y2)
Nuevo (x2) 5/16=0,3125 11/16=0,6875 1
(h(y1/x2)) (h(y2/x2))

- El 31,25% de los pacientes con el tratamiento


nuevo, tienen problemas neuronales altos
- El 68,75% de los pacientes con el tratamiento
nuevo, tienen problemas neuronales bajos
Muestreo Probabilístico
Es requisito que todos y cada uno de los elementos
de la población tengan la misma probabilidad de
ser seleccionados (azar)

Se debe tener disponible un listado completo de


todos los elementos de la población, a esto se le
llama MARCO DE MUESTREO.

27
TIPOS DE MUESTREO
ALEATORIO SIMPLE (Muestreo Simple al Azar)

Cada sujeto tiene una probabilidad igual de ser


seleccionado para el estudio. Se necesita una lista
numerada de las unidades de la población que se quiere
muestrear.

Ejemplo :
Cobertura de la vacuna anti- sarampión entre 1200
Pasos : niños
◦ Determinar el tamaño de la muestra de una escuela X :
◦ Numerar los individuos de 1 a n ◦ Muestra = 60
◦ Tirar unidades al azar (probabilidad igual) ◦ Hacer una lista de todos los niños
◦ Numerarlos de 1 a 1200
◦ Selección aleatoria de 60 números

28
ALEATORIO SISTEMÁTICO
Ejemplo :
• Población (N) : 12,000
• Muestra requerida (n) : 600
• Calcular el intervalo de muestreo (k) = 12,000 / 600 = 20
• Escoger el 1er numero al azar [1 - 20]
• Añadir k para escoger la siguiente unidad y así sucesivamente hasta
completar n.

1er # = 12
k= 20

29
Muestreo Estratificado.

Cuando la muestra incluye subgrupos representativos


(estratos) de los elementos de estudio con características
específicas: urbano, rural, nivel de instrucción, año
académico, carrera, sexo, grupo étnico, edad, paridad etc.
En cada estrato para obtener el tamaño de la muestra se
puede utilizar el muestreo aleatorio o sistemático.

Ejemplo: Estudiantes de la Carrera


de Medicina 2005 I año =20% II
año=18% III año =15% IV año=30%

30
Muestreo por Racimos (Cluster o Conglomerado)
Conglomerados: son unidades geográficas (distritos, Limitantes: financieras, tiempo, geografía y otros
pueblos, organizaciones, clínicas) obstáculos. Se reducen costos, tiempo y energía al
Facultad de Ciencias Económicas considerar que muchas veces las unidades de análisis se
Facultad de Ciencias Jurídicas y Sociales encuentran encapsuladas o encerradas en determinados
Facultad de Química y Farmacia lugares físicos o geográficos: Conglomerados.

Unidad de análisis: sujeto o sujetos


Unidad Muestral en este caso: conglomerado
a través del cual se logra el acceso a la unidad
de análisis.
Selección en 2 etapas:
◦ Los racimos o conglomerados
◦ En los racimos se seleccionan a los sujetos a
ser medidos. Población, Localidades,
Viviendas. Croquis.

31
Video probabilidades
https://www.youtube.com/watch?v=2XWejSaiw
NE

https://www.youtube.com/watch?v=xYco67hkE
Cs

Tablas de contingencia
https://www.youtube.com/watch?v=CEWJZxFp
C8w&t=205s

https://www.youtube.com/watch?v=swOYG7bg
3Lk

Muestreos

https://www.youtube.com/watch?v=MptL2R3o
11Y

https://www.youtube.com/watch?v=Z39oSkQ1i
dE 32

También podría gustarte