Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Asignatura: BIOESTADÍSTICA
INVESTIGACIÓN
UNIDAD II
PROBABILIDADES Y MUESTREO
Marzo, 2016
1
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Presentación
En el tema 3 se dan los elementos básicos para comprender la teoría del muestreo
estadístico haciendo mayor énfasis en los muestreos aleatorios.
Objetivos
Desarrollo de Contenidos:
2
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
3
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Espacio Muestral: se denota con la letra mayúscula “S”, es el conjunto de todos los
posibles resultados de un experimento. (finito o infinito).
Evento ó suceso: es uno o más elementos del espacio muestral, se denotan con las
letras mayúsculas A, B, … C, también pueden denotarse como A1, A2, … An o B1, B2…
Bn.
Los eventos pueden ser simples o compuestos, los primeros hacen referencia a que
toma un solo elemento dentro del conjunto S, mientras que un evento compuesto
es un subconjunto dentro del espacio muestral.
4
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 (𝐴)=3/6=0.5≈50%
Existe una probabilidad del 50% que al lanzar el dado se obtenga un número impar.
Por regla general las probabilidades están dadas entre cero y uno.
Pueden representarse como porcentajes para facilitar su interpretación
multiplicando por 100 la probabilidad.
Un experimento que tiene un espacio muestral S y un número finito de
eventos se puede expresar como un diagrama de Venn.
5
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Mutuamente excluyentes.
Cuando A y B no tienen elementos o resultados en común, se dice que son eventos
mutuamente excluyentes o disjuntos.
6
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
7
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
8
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Nota: se inicia poniendo la intersección de todos los conjuntos, se resta la intersección a los
conjuntos que la contienen.
Probabilidad Total
Si un espacio muestral S, se divide según criterios de partición:
a) La unión de los diferentes segmentos es igual al espacio muestral S.
B1 Ս B2 Ս B3,…, Ս Bn = S
b) Los segmentos son mutuamente excluyentes, es decir Bi Ո Bj =0 para todo i y j.
9
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Ejemplo.
Solución:
Se deben definir claramente cuáles son los eventos
A:{que sea defectuoso}
B1:{que sea producido por la MQ1}
B2:{que sea producido por la MQ2}
B3:{que sea producido por la MQ3}
A/B1:{defectuoso, producido por MQ1}
A/B2:{defectuoso, producido por MQ2}
A/B3:{defectuoso, producido por MQ3}
P(A)=0,5*0,04+0,3*0,04+0,2*0,05=0,042
Dependiendo del tipo de problema se debe tener en cuenta que se debe usar el
enfoque que responda a las condiciones de cada situación, se tienen los siguientes
enfoques: el empírico o “a Posteriori”, el teórico y el subjetivo.
10
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Fumadores ni hi
Sí 125 0.25
No 375 0.75
Total 500 1.00
11
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Suponga que tiene dos eventos A y B que pertenecen al espacio muestral S, el evento
A ya ocurrió y “la probabilidad de B dado que A ya ocurrió” se expresaría como
“ P( B A) ”
P( B A)
P( B A)
P( A)
Siempre que P(A) >0
P( A B)
P( A B)
P( B)
Siempre que P(B) >0
Propiedad:
La probabilidad de intersección A y B se puede obtener P(AՈB) = P(A)*P(BA)
Si se dispone de los datos en una tabla de 2x2 (tabla de contingencia), se divide cada
valor de la tabla por el total y se obtienen las probabilidades marginales en los
bordes de la tabla y las probabilidades conjuntas o intersecciones dentro de la tabla.
12
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Hay que tener en cuenta que cada fila y columna de la tabla es un evento, por lo
tanto, se tienen 4 eventos:
Probabilidades marginales:
P(P) = 0.54 El 54% de las muestras fueron positivas para virus respiratorios.
P(N) = 0.46 El 46% de las muestras fueron negativas para virus respiratorios.
P(A) = 0.42 El 42% de las muestras fueron analizadas por la bacterióloga A
P(A) = 0.48 El 48% de las muestras fueron analizadas por la bacterióloga B
13
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Eventos independientes:
Si los eventos A y B son independientes, es decir, la ocurrencia de uno no afecta la
probabilidad de ocurrencia del otro
Ejemplo: la probabilidad de que un esposo y una esposa estén vivos en 20 años son
P(H)=0.8 y P(F)=0.9 respectivamente, suponga que estos son eventos
independientes.
Hallar:
a) la probabilidad de que en 20 años ambos vivan,
P(ambos vivos)= P(H Ո F) = P(H)*P(F)=0.8*0.9=0.72
b) ninguno viva.
P(ninguno viva) = P(H´)*P(F´)=0.2*0.1=0.02
14
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Donde,
P(B1/A)=(0.5)*(0.04)/[(0.5*0.04)+(0.3*0.04)+(0.2*.05)]=0,476
15
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
16
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Para las variables cuantitativas discretas los modelos de probabilidad más usados
son las Distribuciones Binomial, Multinomial, Hipergeométrica y Poisson; para el
caso de variables cuantitativas continuas los modelos de probabilidad son las
Distribuciones Chi-cuadrado, Exponencial, Gamma, T-Student y Normal estándar. La
ventaja de que la variable aleatoria de interés se distribuya según los modelos
mencionados consiste en que ya cuentan con las fórmulas para el cálculo de la
probabilidad e incluso tablas donde ya están calculadas estas.
Esta distribución fue ideada para variables cuantitativas discretas. Se deben tener 3
elmentos para su calculo que son: el tamaño de la muestra “n”, la probabilidad de
éxito “p” y la probabilidad de fracaso (no éxito) “q”, donde q=1-p.
n
P( X x) p x q n x
x
17
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Solución:
La variable X en este caso sería el número de personas que sobreviven a la
enfermedad, la probabilidad de éxito es p=0.4 y la probabilidad de fracaso es q=0.6,
n=15
15
P( X 5) (0.4)5 (0.6)155
5
P( X 5) 0.1859
P(X ≤ 5) = P(X=0) + (PX = 1) + P(X =2) + P(X =3) + P(X =4)+ P(X =5)
15
P( X 0) (0.4) 0 (0.6)150 = 0.00047
0
15
P( X 1) (0.4)1 (0.6)151 = 0.0047
1
15
P( X 2) (0.4) 2 (0.6)152 = 0.0219
2
18
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
15
P( X 3) (0.4)3 (0.6)153 = 0.0634
3
15
P( X 4) (0.4) 4 (0.6)154 =0.1268
4
15
P( X 5) (0.4)5 (0.6)155 =0.1859
5
P(X ≤ 5) = 0.00047+0.0047+0.0219+0.06234+0.1268+0.1859
P(X ≤ 5) = 0.4032
19
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
20
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Ver anexo 2
P(x)
21
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
x
z
La variable original X con una media particular μ y una varianza σ2, ahora se obtuvo
una variable transformada Z la cual tiene μ=0 y varianza σ2=1.
Propiedades:
1. Asintótica, es decir la distribución normal no corta el eje X (eje horizontal), es
decir, se mueve entre menos infinito y más infinito.
2. Simetría, la distribución es simétrica con relación a su media.
3. La distribución normal sólo se usa para variables cuantitativas continuas.
Ejemplo. En Cali en el año 2015 nacieron 27560 niños con madres residentes en el
municipio, el peso al nacer en promedio es de 3150 gramos y tiene una desviación
estándar de 400 gramos, se sabe también que el peso al nacer sigue una distribución
normal.
¿Cuál es la probabilidad de que nazcan niños con Bajo Peso (inferior a 2500 gramos?
Respuesta:
22
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
x
Se estandariza la variable X a la Z a través de la expresión z
P( X 2500) ?
𝑋 − 𝜇 2500 − 3150
𝑃( ≤ ) = 𝑃(𝑍 ≤ −1,63)
𝜎 400
Por lo cual se sabe que la probabilidad de que un niño tenga un peso inferior a 2500
gramos es del 5.155%
23
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Se debe tener presente que la tabla de probabilidad genera un área hacia el lado
izquierdo del corte que se le haga a la campana, ahora nos interesa conocer la
probabilidad de obtener niños con pesos mayores a 3600 gramos.
P(X> 3600)=?
Solución:
P(X> 3600)= 1-P(X<3600) esto gracias a la propiedad de que toda el área bajo la
campana equivale a una probabilidad de 1.
𝑋 − 𝜇 3600 − 3150
𝑃( ≤ ) = 𝑃(𝑍 ≤ 1,13)
𝜎 400
Solución:
P(a<X<b)=P(x<b)-P(x<a)
P(2500≤X≤3600)=P(x≤b)-P(x≤a)
24
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
La probabilidad de tener niños con pesos entre 2500 y 3600 gramos es del 81.921%
Ejercicios de práctica.
25
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Para medir ciertas características o atributos de una población por efectos de tiempo
y disponibilidad de recursos económicos no es posible realizar un censo del total de
individuos de una región o lugar (institución, viviendas, escuelas, etc.), por lo cual se
toman muestras o parte de los sujetos para realizar las mediciones; hay dos tipos de
muestreos los probabilísticos (aleatorios) y los no probabilísticos (no aleatorios).
3.1. Definiciones
Población objetivo: son todos los individuos que cumplen con los criterios de
inclusión del estudio para ser elegibles dentro de la muestra.
26
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
3.2.2. Muestreo estratificado: este tipo de muestreo es utilizado para casos donde
no se pueden juntar los subgrupos de la población porque hay variables que
aumentan la variabilidad. Por ejemplo el IMC de una población adulta, es necesario
estratificar la muestra para hombres y para mujeres dado que este indicador es
diferente según el sexo.
Muestreo por conveniencia, son las personas que van llegando a un sitio o servicio.
28
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
ACTIVIDADES DE APRENDIZAJE
PREECLAMPSIA
SI ( E ) NO ( K ) Total
ANTECEDENTE
Positivo (P) 63 19 82
HTA
29
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Se conoce que el IMC sigue una distribución normal, se obtuvo información de 3510
mujeres, el IMC promedio fue de 27.5 y la desviación estándar 3.1, calcule las
siguientes probabilidades:
30
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
AUTOEVALUACIÓN.
31
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Anexo 1
Distribución Chi-cuadrado
32
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
Anexo 2
Distribución t-Student
La t-Student se usa cuando se desea estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño n<30
Depende de un parámetro “grados de libertad” denotado como “V” o “gl”, el cual es igual a
n-1, /2, donde es el nivel de significancia definido por el investigador, este se divide en
dos para obtener /2
33
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016
BIBLIOGRAFÍA
Cruz, CA. Probabilidades y Muestreo. Unidad II. En: Asignatura de Biometría para la
Maestría en Enfermería, Dirección de Nuevas Tecnologías y Educación Virtual,
Universidad del Valle, 2008.
Beth, Dawson y Robert G., Trapp. Bioestadística médica. 4ta. Edición. Editorial Manual
moderno. Mexico, 2005.
34