00 - Guia Probabilidad Csociales

C. Mora.
Notas de clase Bioestadística,

Universidad del Valle, Colombia 2016
UNIVERSIDAD DEL VALLE

FACULTAD DE SALUD
PROGRAMAS DE POSTGRADO
Asignatura: BIOESTADÍSTICA
INVESTIGACIÓN
UNIDAD II
PROBABILIDADES Y MUESTREO
Tema 1. Introducción a la Probabilidad

Tema 2. Modelos de Probabilidad y aplicaciones
Tema 3. Distribución de Muestreo
Elaboró: Claudia Patricia Mora

Estadística, MSc. En Epidemiología
E-mail: claudia.mora@correounivalle.edu.co
Marzo, 2016
1
C. Mora. Notas de clase Bioestadística,
UNIDAD II. PROBABILIDAD Y MUESTREO ESTADÍSTICO
Presentación
En la Unidad I los estudiantes tuvieron la oportunidad de conocer elementos básicos

de la estadística descriptiva, distinguir los tipos de variables y sus escalas de
medición, construir e interpretar tablas de frecuencias, elaborar gráficos, diferenciar
entre población y muestra; calcular e interpretar diversos indicadores como las
medidas de tendencia central, de dispersión y de posición no central.
En la presente unidad se abordarán conceptos relacionados con la probabilidad y

teoría del muestreo como base fundamental para comprender la estadística
inferencial, aporta a los estudiantes de Biometría herramientas adicionales para la
aplicación de modelos de probabilidad en su ejercicio profesional.
Con el tema 1 se estudiaran algunas situaciones en las que participan las

probabilidades. Se realizaran algunos cálculos de probabilidad y se presentaran
propiedades en relación a la intersección, unión, complemento.
Con el tema 2 se identificarán algunos modelos o patrones en los cuales es

relativamente simple calcular las probabilidades. Para ilustrar el manejo se
mencionan los modelos, Binomial, Hipergeométrico y Poisson en el caso de variables
discretas y el modelo normal para el caso de variables continúas.
En el tema 3 se dan los elementos básicos para comprender la teoría del muestreo
estadístico haciendo mayor énfasis en los muestreos aleatorios.
Objetivos
1. Reconocer los enfoques básicos de la teoría de probabilidades

2. Identificar los modelos para el cálculo de probabilidades
3. Aplicar las distribuciones de probabilidad a problemas de la vida real
4. Identificar los diversos tipos de muestreo estadístico
Desarrollo de Contenidos:
En esta unidad se estudiarán tres temas principales relacionados con las

probabilidades y muestreo, así:
Tema 1: Introducción a la Probabilidad: Conceptos básicos de probabilidad,

probabilidad de la intersección, probabilidad condicional, probabilidad de la unión.
2
Tema 2: Modelos de Probabilidad. Definiciones. Métodos de conteo: reglas de la

adición y multiplicación, permutación y combinaciones. Distribuciones de
probabilidad: distribuciones de probabilidad para variables cuantitativas discretas y
continuas, uso de tablas de probabilidad e interpretaciones. Teorema del Limite
Central.
Tema 3: Muestreo estadístico. Definiciones de muestreo, tipos de muestreo, cálculo

de muestreo aleatorio simple y métodos de selección de muestras aleatorias.
3
TEMA 1. INTRODUCCIÓN A LA PROBABILIDAD
El estudio de la probabilidad como rama de las matemáticas se remonta a más de

300 años, cuanto tuvo sus orígenes en preguntas de juegos de azar; sin embargo, en
el lenguaje cotidiano el termino probabilidad representa nuestra confianza en que
un suceso ocurrirá en el futuro, “mañana lo más probable es que llueva”, “lo más
probable es que se cure si sigue las indicaciones médicas”, “lo más probable es que
Pedro llegue puntual a la cita”.
El concepto de probabilidad es necesario cuando se desea investigar sobre sucesos

físicos, fenómenos naturales, biológicos o sociales que generan observaciones que
no pueden predecirse con certeza.
“El termino probabilidad se refiere al estudio de la aleatoriedad y la incertidumbre”.

Jay L. Devore, Probabilidad
para ingeniería y ciencias.
1.1. Definiciones básicas
Experimento: cualquier acción o proceso que genera observaciones (o un conjunto

de datos), presenta las siguientes características:
Es posible repetirlo varias veces sin cambiar esencialmente las condiciones.

Aunque no pueda decir con certeza cuál será el resultado, si se conocen todos los
posibles resultados.
Espacio Muestral: se denota con la letra mayúscula “S”, es el conjunto de todos los
posibles resultados de un experimento. (finito o infinito).
Evento ó suceso: es uno o más elementos del espacio muestral, se denotan con las
letras mayúsculas A, B, … C, también pueden denotarse como A1, A2, … An o B1, B2…
Bn.
Los eventos pueden ser simples o compuestos, los primeros hacen referencia a que
toma un solo elemento dentro del conjunto S, mientras que un evento compuesto
es un subconjunto dentro del espacio muestral.
Eventos colectivamente exhaustivos: Constan de todos los posibles resultados de

un experimento y constituyen ser el espacio muestral S.
Ejemplo. El lanzamiento de un dado {1, 2, 3,4, 5, 6} es un evento colectivamente

exhaustivo, ya que la probabilidad de unión de todos los eventos es 1.
4
Ejemplo: suponga que se desea estudiar el comportamiento de lanzar un dado para

ello usted puede definir Experimento, Espacio Muestral (S) y los eventos.
Experimento: {Lanzar un dado}
Espacio muestral S: {1, 2, 3, 4, 5, 6}
Evento A:{lanzar y que salga impar}={1, 3, 5}
¿Cuál es la probabilidad de que ocurra el evento A?
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 (𝐴)=3/6=0.5≈50%
Existe una probabilidad del 50% que al lanzar el dado se obtenga un número impar.
1.2. Propiedades de probabilidad
 Por regla general las probabilidades están dadas entre cero y uno.
 Pueden representarse como porcentajes para facilitar su interpretación
multiplicando por 100 la probabilidad.
 Un experimento que tiene un espacio muestral S y un número finito de
eventos se puede expresar como un diagrama de Venn.
Unión de dos eventos A y B, se denota A Ս B, es el evento formado por todos los

resultados que están en A ó B.
5
Intersección de dos eventos A y B, se denota A Ո B, es el evento formado por todos

los resultados que están en A y B.
Complemento de un evento A, se denota A’.

El complemento del evento A es el conjunto de todos los resultados en S que no
están en A.
Mutuamente excluyentes.
Cuando A y B no tienen elementos o resultados en común, se dice que son eventos
mutuamente excluyentes o disjuntos.
6
 Sean A, B y C tres eventos que pertenecen al espacio muestral S para calcular la

probabilidad en cada caso:
i). Para cualquier evento A, P(A) = 1- P(A`)  P(A`)= 1- P(A)
ii) La probabilidad de A y B (intersección)  P(A Ո B)= no. elementos en A y B /

n
donde n es el número total de elementos de S.
iii) La probabilidad de A o B (unión)  P(A Ս B) se lee “probabilidad de A o B”

si los eventos no son mutuamente excluyentes, entonces P(A Ո B)≠0, por lo tanto,
P(A U B) = P(A) + P(B) - P(A Ո B).
iv) La probabilidad de la unión de los eventos A, B y C  P(A U B U C), se lee” la

probabilidad del evento A o B o C”, es
P(A U B U C)= P(A) + P(B) + P(C) – P(AՈB)- P(AՈC)- P(BՈC)+P(AՈBՈC)
v) La probabilidad de unión de los evento A y B cuando estos son mutuamente

excluyuentes, hay que tener en cuenta que P(A Ո B)=0, por lo tanto
P(A U B) = P(A) + P(B)
7
Ejemplo: La empresa Surticondor cuenta con 50 empleados de los cuales 20 incluyen en su

desayuno un vaso de leche, otros 25 desayunan con café sin leche, hay 5 que desayunan café
con leche y 10 no incluyen ninguna de las dos bebidas, represente estos elementos en un
diagrama de Venn.
A:{personas que consumen leche}

B:{personas que consumen café}
C:{personas que no consumen ninguna de las bebidas}
Calcule las siguientes probabilidades:
a. La probabilidad de tomar leche dado que toma café

b. No tomar café
c. Probabilidad de tomar leche y cafe
8
Probabilidad de que ocurra A  P(A) = 20/50 = 0.4
Probabilidad de que ocurra B  P(B) = 25/50 =0.5
Probabilidad de que ocurra C  P(C)=10/50=0.05
Probabilidad de que ocurra A y B P (AՈB) = 5/50= 0.1
Probabilidad de que ocurra A o B  P(AՍB) = P(A)+P(B) – P(AՈB)

P(AՍB) = 0.4+0.5-0.1= 0.8
Probabilidad de que ocurra B y C  P(B ՈC)= 0 (mutuamente excluyentes)
Probabilidad de que ocurra B o C  P(B ՍC)= P(B)+P(C)= 0.5+0.05= 0.55
Probabilidad de A’  P(A’) = 1 – P(A) = 1 – 0.4 = 0.6
Las probabilidades también se pueden representar en un diagrama de Venn, así:
Nota: se inicia poniendo la intersección de todos los conjuntos, se resta la intersección a los
conjuntos que la contienen.
Probabilidad Total
Si un espacio muestral S, se divide según criterios de partición:
a) La unión de los diferentes segmentos es igual al espacio muestral S.
B1 Ս B2 Ս B3,…, Ս Bn = S
b) Los segmentos son mutuamente excluyentes, es decir Bi Ո Bj =0 para todo i y j.
La probabilidad total está dada por:
9
Ejemplo.
Para el empaque de leche en polvo en una reconocida empresa de lácteos se emplean 3

máquinas que producen: MQ1=50%, MQ2=30% y MQ3=20% de la producción total. Los
defectos en cada máquina son 4%, 4% y 5%. Si se va a empacar la siguiente bolsa de leche
en polvo ¿Cuál es la probabilidad total de que la próxima bolsa de leche sea empacada de
manera defectuosa?.
Solución:
Se deben definir claramente cuáles son los eventos
A:{que sea defectuoso}
B1:{que sea producido por la MQ1}
A/B1:{defectuoso, producido por MQ1}
Las probabilidades dadas por el ejercicio son:

P(B1)=0,5 P(B2)=0,3 P(B3)=0,2
P(A/B1)=0,04 P(A/B2)=0,04 P(A/B3)=0,05
Por lo tanto, la probabilidad total de defectuosos es
P(A)=0,5*0,04+0,3*0,04+0,2*0,05=0,042
En total el 4,2% de la producción sale defectuosa.
1.3. Enfoques de Probabilidad
Dependiendo del tipo de problema se debe tener en cuenta que se debe usar el
enfoque que responda a las condiciones de cada situación, se tienen los siguientes
enfoques: el empírico o “a Posteriori”, el teórico y el subjetivo.
1.2.1. Enfoque Empírico o “a Posteriori”
Se usa cuando el investigador no conoce previamente la probabilidad de que ocurra

un suceso.
10
Ejemplo: Se desea saber ¿cuál es la probabilidad de que una persona seleccionada

al azar de la comuna 18 de Cali sea fumadora?.
Para ello se tomó una muestra de 500 personas

mayores de 15 años de la comuna 18 de Cali,
logrando identificar si fuman o no.
Fumadores ni hi
Sí 125 0.25
No 375 0.75
Total 500 1.00
Estas frecuencias, se pueden aproximar a probabilidades si se garantiza que la

muestra fue seleccionada al azar, de tal manera que si se escoge una persona al azar
de esta comuna de Cali, la probabilidad de que sea fumador es del 0.25 o 25%.
1.2.2. Enfoque teórico o “a priori”
Este enfoque implica la determinación de la probabilidad de algún evento antes de

que ocurra, se relaciona con mayor frecuencia con las apuestas y juegos de azar. Se
conocen todos los posibles resultados del experimento.
Ejemplo: Cuando el experimento es “lanzar un dado y registrar el puntaje de la cara

superior”, se puede considerar (supuesto) que todos los resultados son igualmente
probables y entonces la probabilidad de obtener “5” sería 1/6.
Numero de resultados favorables al evento A

P( A) 
Número total de resultados
1
P(5) =
6
1.2.3. Enfoque subjetivo:
Se utiliza cuando se desea asignar una probabilidad a un suceso que nunca ha

ocurrido o cuando no sea posible repetir el experimento bajo condiciones
semejantes, ni asignar probabilidades en forma teórica, se debe utilizar a un experto
en el tema quien asignará con un criterio personal o subjetivo (a partir de su
experiencia, condiciones del paciente, del entorno, etc.) la probabilidad de
determinado evento.
11
Ejemplo: un médico dice a su paciente que la probabilidad de éxito en la cirugía

puede ser del 80%.
1.4. Probabilidades marginal y condicional
1.4.1. Probabilidad condicional
La probabilidad condicional es el cálculo de la probabilidad de que un evento ocurra

dado que otro evento ya ocurrió.
Suponga que tiene dos eventos A y B que pertenecen al espacio muestral S, el evento
A ya ocurrió y “la probabilidad de B dado que A ya ocurrió” se expresaría como
“ P( B A) ”
Para calcular la probabilidad condicional se usa la siguiente expresión matemática:
P( B  A)
P( B A) 
P( A)
Siempre que P(A) >0
También se puede obtener la “probabilidad de A dado que B ya ocurrió” se

expresaría como “ P( A B) ” y se calcula:
P( A  B)
P( A B) 
P( B)
Siempre que P(B) >0
Propiedad:
La probabilidad de intersección A y B se puede obtener P(AՈB) = P(A)*P(BA)
1.4.2. Probabilidades marginales y conjuntas
Si se dispone de los datos en una tabla de 2x2 (tabla de contingencia), se divide cada
valor de la tabla por el total y se obtienen las probabilidades marginales en los
bordes de la tabla y las probabilidades conjuntas o intersecciones dentro de la tabla.
Ejemplo: en un laboratorio clínico se dispone de prueba para virus respiratorios por

InmunoFlurencencia Indirecta (IFI), se cuenta con dos bacteriólogas para el análisis
de las muestras, los 240 resultados del mes de febrero son:
12
Para calcular las probabilidades conjuntas y marginales se dividen todos los

elementos por el total de la tabla, en este caso n=240 resultados de laboratorio (240
pacientes), obteniendo la siguiente tabla de probabilidades:
Hay que tener en cuenta que cada fila y columna de la tabla es un evento, por lo
tanto, se tienen 4 eventos:
P: {la prueba IFI es positiva}

N: {la prueba IFI es negativa}
A: {la bacterióloga A es la que analiza la muestra}
B: {la bacterióloga B es la que analiza la muestra}
Las probabilidades conjuntas son las mismas probabilidades intersección de los

eventos, mientras que las probabilidades marginales corresponden a la ocurrencia
de uno de los eventos en particular.
Probabilidades marginales:
P(P) = 0.54  El 54% de las muestras fueron positivas para virus respiratorios.
P(N) = 0.46  El 46% de las muestras fueron negativas para virus respiratorios.
P(A) = 0.42  El 42% de las muestras fueron analizadas por la bacterióloga A
P(A) = 0.48  El 48% de las muestras fueron analizadas por la bacterióloga B
Las probabilidades conjuntas:
13
A partir de las probabilidades obtenidas en la tabla de contingencia es posible

calcular probabilidades condicionales, Si se escoge al azar uno de los pacientes y se
encuentra que su resultado es negativo, ¿Cuál es la probabilidad de que haya sido
analizado por la bacterióloga A?
La probabilidad de que la muestra la haya analizado la bacterióloga A dado que el

resultado fue Negativo (N) es 0,28 (en porcentaje 28%).
Eventos independientes:
Si los eventos A y B son independientes, es decir, la ocurrencia de uno no afecta la
probabilidad de ocurrencia del otro
Sea A y B dos eventos definidos en el espacio muestral S, si son independientes,

entonces
P(AՈB)= P(A) * P (B)
Entonces, P(A I B) = P(A) y P(B I A) = P(B)
Ejemplo: la probabilidad de que un esposo y una esposa estén vivos en 20 años son
P(H)=0.8 y P(F)=0.9 respectivamente, suponga que estos son eventos
independientes.
Hallar:
a) la probabilidad de que en 20 años ambos vivan,
P(ambos vivos)= P(H Ո F) = P(H)*P(F)=0.8*0.9=0.72
b) ninguno viva.
P(ninguno viva) = P(H´)*P(F´)=0.2*0.1=0.02
1.5. Teorema de Bayes
El teorema de Bayes fue una proposición planteada por el matemático, filósofo y

ministro presbiteriano inglés Thomas Bayes (1702-1761).
14
Sea {A1, A2,…, Ai,…An} un conjunto de sucesos

mutuamente excluyentes y exhaustivos, tales que la
probabilidad de cada uno de ellos es distinta de cero (0).
Sea B un suceso cualquiera del que se conocen las
probabilidades condicionales P(B I Ai). Entonces, la
probabilidad P(Ai I B) viene dada por la expresión:
Donde,
 P(Ai) son las probabilidades a priori

(conocidas),
 P(B I Ai) es la probabilidad de B en la hipótesis Ai,
 P(Ai I B) son las probabilidades a posteriori (no ocurrida).
La formula de Bayes es:
Ejemplo: continuando con el ejemplo visto en probabilidad condicional, en el cual

para el empaque de leche en polvo en una reconocida empresa de lácteos se emplean 3
máquinas que producen: MQ1=50%, MQ2=30% y MQ3=20% de la producción total. Los
defectos en cada máquina son 4%, 4% y 5%. Se escoge al azar una bolsa y esta resulta
defectuosa. ¿Cuál es la probabilidad de que haya sido producida por la MQ1?.
A: {bolsa de leche defectuosa}

B1:{Que sea empacado por MQ1}
P(A)=0.042 (probabilidad total)
P(A/B1)=0.04
P(B1/A)=(0.5)*(0.04)/[(0.5*0.04)+(0.3*0.04)+(0.2*.05)]=0,476
15
La probabilidad de que una bolsa de leche en polvo seleccionada al azar sea

empacada de manera defectuosa y haya sido producida por la MQ1, es del 47.6%
16
TEMA 2. MODELOS DE PROBABILIDAD
El comportamiento de una variable aleatoria puede describirse a través de un

modelo de probabilidad, el cual es una función matemática que permite estimar la
posibilidad de que la variable tome un valor específico, es decir, su distribución de
probabilidad.
En la actualidad se cuenta con grandes avances en el desarrollo de modelos de

probabilidad que explican las variables cuantitativas tanto discretas como continuas,
en casos excepcionales un investigador tendrá que desarrollar su propio modelo
para explicar el comportamiento de sus variables.
Para las variables cuantitativas discretas los modelos de probabilidad más usados
son las Distribuciones Binomial, Multinomial, Hipergeométrica y Poisson; para el
caso de variables cuantitativas continuas los modelos de probabilidad son las
Distribuciones Chi-cuadrado, Exponencial, Gamma, T-Student y Normal estándar. La
ventaja de que la variable aleatoria de interés se distribuya según los modelos
mencionados consiste en que ya cuentan con las fórmulas para el cálculo de la
probabilidad e incluso tablas donde ya están calculadas estas.
2.1. Distribución Binomial.
Esta distribución fue ideada para variables cuantitativas discretas. Se deben tener 3
elmentos para su calculo que son: el tamaño de la muestra “n”, la probabilidad de
éxito “p” y la probabilidad de fracaso (no éxito) “q”, donde q=1-p.
La formula para calcular la probabilidad de que la variable X tome un valor particular

“x” es:
n
P( X  x)    p x q n x
 x
Condiciones para el uso del modelo Binomial:

• n ensayos u observaciones
• Sólo dos posibles resultados Éxito y Fracaso
• Probabilidad de Éxito constante en cada ensayo
• Resultados independientes
Ejemplo: La probabilidad de que un paciente se recupere de una enfermedad rara

en la sangre es de 0.4.
Si se sabe además que en Cali hay 15 personas con esta enfermedad.
¿Cuál es la probabilidad de que sobrevivan 5 personas?
17
Solución:
La variable X en este caso sería el número de personas que sobreviven a la
enfermedad, la probabilidad de éxito es p=0.4 y la probabilidad de fracaso es q=0.6,
n=15
Usando la formula matemática sería:

n
P( X  x)    p x q n x
 x
15 
P( X  5)   (0.4)5 (0.6)155
5 
P( X  5)  0.1859
La probabilidad de que 5 personas con la enfermedad rara en la sangre de Cali

sobrevivan es del 18.59%
Cuando se requiere calcular la probabilidad acumulada, es decir cuando la

variable X es menor o igual a un valor determinado k P(X≤ k), esto se puede enunciar
como “probabilidad de que X tome como máximo el valor k” o esta se calcula de la
siguiente forma:
P(X≤ k) = P(X=0) + (PX = 1) + …. + P(X =k)
Continuando con el ejemplo, ¿cuál es la probabilidad de que sobrevivan como

máximo 5 personas?.
P(X ≤ 5) = P(X=0) + (PX = 1) + P(X =2) + P(X =3) + P(X =4)+ P(X =5)
15 
P( X  0)   (0.4) 0 (0.6)150 = 0.00047
0 
15 
P( X  1)   (0.4)1 (0.6)151 = 0.0047
1 
15 
P( X  2)   (0.4) 2 (0.6)152 = 0.0219
2 
18
15 
P( X  3)   (0.4)3 (0.6)153 = 0.0634
3 
15 
P( X  4)   (0.4) 4 (0.6)154 =0.1268
4 
15 
P( X  5)   (0.4)5 (0.6)155 =0.1859
5 
Finalmente, se deben sumar los resultados de las probabilidades puntuales y se

obtiene la probabilidad requerida
P(X ≤ 5) = 0.00047+0.0047+0.0219+0.06234+0.1268+0.1859
P(X ≤ 5) = 0.4032
La probabilidad de que sobrevivan como máximo 5 personas es del 40.32%.
Estas probabilidades también se pueden calcular usando la tabla de la distribución

acumulada de la Binomial.
Método usando la tabla de Distribución
19
20
2.1. Distribución Chi-cuadrado
Esta distribución se utiliza para inferencia estadística para evaluar la independencia o

asociación de variables cualitativas, para el cálculo de los intervalos de confianza para
la varianza, los cuales se tratarán en detalle en la Unidad de Inferencia Estadística de
este curso.
Tabla de puntos críticos - Anexo 1
2.2. Distribución t-Student
Ver anexo 2
2.3. Distribución Normal
Conocida también como distribución gaussiana en honor a

su inventor Carl Friedrich Gauss. Matemático Alemán
(1777-1855)
Es utilizada para variables cuantitativas continuas, tiene

múltiples aplicaciones en diversos campos del
conocimiento:
Teoría Six Sigma – Control de Calidad industrial

Indicadores antropométricos
Comportamiento del peso al nacer
Glicemia en sangre
Evaluación de aprendizaje (Educación)
Evaluación de mercados competitivos
En el eje x se ubicará la variable cuantitativa de interés en el eje vertical y la

probabilidad p(x)
P(x)
21
Se debe transformar la variable X en una nueva variable Z la cual se obtiene con la

siguiente formula:
x
z

La variable original X con una media particular μ y una varianza σ2, ahora se obtuvo
una variable transformada Z la cual tiene μ=0 y varianza σ2=1.
Propiedades:
1. Asintótica, es decir la distribución normal no corta el eje X (eje horizontal), es
decir, se mueve entre menos infinito y más infinito.
2. Simetría, la distribución es simétrica con relación a su media.
3. La distribución normal sólo se usa para variables cuantitativas continuas.
Ejemplo. En Cali en el año 2015 nacieron 27560 niños con madres residentes en el
municipio, el peso al nacer en promedio es de 3150 gramos y tiene una desviación
estándar de 400 gramos, se sabe también que el peso al nacer sigue una distribución
normal.
¿Cuál es la probabilidad de que nazcan niños con Bajo Peso (inferior a 2500 gramos?
Sea X la variable peso al nacer  P( X  2500)  ?
Respuesta:
22
x
Se estandariza la variable X a la Z a través de la expresión z 

P( X  2500)  ?
𝑋 − 𝜇 2500 − 3150
𝑃( ≤ ) = 𝑃(𝑍 ≤ −1,63)
𝜎 400
Se ubica en la tabla normal
Por lo cual se sabe que la probabilidad de que un niño tenga un peso inferior a 2500
gramos es del 5.155%
23
Se debe tener presente que la tabla de probabilidad genera un área hacia el lado
izquierdo del corte que se le haga a la campana, ahora nos interesa conocer la
probabilidad de obtener niños con pesos mayores a 3600 gramos.
P(X> 3600)=?
Solución:
P(X> 3600)= 1-P(X<3600) esto gracias a la propiedad de que toda el área bajo la
campana equivale a una probabilidad de 1.
µ=3150 3600 X: peso al nacer en gramos
𝑋 − 𝜇 3600 − 3150
𝑃( ≤ ) = 𝑃(𝑍 ≤ 1,13)
𝜎 400
Ubicamos el z= 1,13 en la tabla de probabilidad y obtenemos que la probabilidad

es 0,87076
P(X> 3600)= 1-P(z<3600) = 1 – 0.87076 = 0,12924
La probabilidad de que nazcan niños con pesos superiores a 3600 gramos es

12.924%
 Probabilidad entre dos valores

Ahora nos interesa saber la probabilidad de que nazcan niños con pesos
entre 2500 y 3600 (peso normal o adecuado) en Cali.
P(2500<X<3600)=?
Solución:
P(a<X<b)=P(x<b)-P(x<a)
P(2500≤X≤3600)=P(x≤b)-P(x≤a)
24
P(2500≤X≤3600) = P(X≤3600) - P(X≤2500)
Estas dos ultimas ya las podemos obtener de la tabla:
P(Z≤1,13) - P(X≤-1,63) = 0.87076 - 0.05155 = 0.81921
La probabilidad de tener niños con pesos entre 2500 y 3600 gramos es del 81.921%
Ejercicios de práctica.
a. Cual es la probabilidad de que nazcan niños con pesos inferiores a 2800

gramos?
b. Cual es la probabilidad de niños con pesos superiores a 4000 gramos?
c. Cual es la probabilidad de niños con pesos entre 2800 y 4000 gramos?
d. Ver ejercicio final en actividades de aprendizaje al final del capitulo.
25
TEMA 3. MUESTREO ESTADÍSTICO
Para medir ciertas características o atributos de una población por efectos de tiempo
y disponibilidad de recursos económicos no es posible realizar un censo del total de
individuos de una región o lugar (institución, viviendas, escuelas, etc.), por lo cual se
toman muestras o parte de los sujetos para realizar las mediciones; hay dos tipos de
muestreos los probabilísticos (aleatorios) y los no probabilísticos (no aleatorios).
3.1. Definiciones
Población: conjunto de todos los elementos de interés en un problema dado. Sin

embargo por situaciones prácticas, es poco posible que tengamos acceso a todos
los elementos de la población no solamente para su estudio sino para seleccionar
elementos de dicha población.
Población objetivo: son todos los individuos que cumplen con los criterios de
inclusión del estudio para ser elegibles dentro de la muestra.
Marco muestral: es el listado de los elementos de la población que sí se encuentran

disponibles para ser seleccionados en una muestra. Por ejemplo, si el estudio es
sobre escolares en Cali, no es tan factible poder tener un listado con los nombres de
todos los escolares de la ciudad, pero puede tenerse una lista de colegios del
municipio, de los cuales se han de seleccionar algunos.
En los colegios seleccionados se cuentan con listados de los grupos y sus
estudiantes, los cuales también serían marcos muestrales, de estos finalmente se
seleccionan los individuos sobre los que se realiza la medición.
Unidad de observación: es el individuo u objeto sobre el cual directamente se

realiza la medición.
Unidad de muestreo: es el área dentro de la cual está la o las unidades de

observación, por ejemplo: unidad de muestreo pueden ser viviendas y las unidades
de observación son mujeres embarazadas que habitan en ellas.
3.2. Tipos de Muestreos aleatorios:
Son muy recomendados cuando se desea extrapolar los resultados a la población de

la cual provienen.
3.2.1. Muestreo Aleatorio Simple (MAS):

Es el tipo de muestreo más comúnmente usado, se caracteriza porque es posible
establecer la probabilidad de extracción de cada elemento de la población, es la
26
técnica de muestreo más aconsejable, aunque en ocasiones no es posible optar por

él, es la base de todos los muestreos aleatorios.
3.2.2. Muestreo estratificado: este tipo de muestreo es utilizado para casos donde
no se pueden juntar los subgrupos de la población porque hay variables que
aumentan la variabilidad. Por ejemplo el IMC de una población adulta, es necesario
estratificar la muestra para hombres y para mujeres dado que este indicador es
diferente según el sexo.
3.2.3. Muestreo por conglomerados: este tipo de muestreo se utiliza para

aprovechar grupos que están conformados previamente, confinados o por la
actividad social están en un mismo lugar. Ejemplo: conglomerado puede ser las
escuelas oficiales y los sujetos a medir son los estudiantes de primaria, para estimar
indicadores antropométricas entre los 5 a 10 años. Es muy recomendable porque
facilita el trabajo de campo y la recolección, pero hay que tener mucho cuidado al
momento de la selección de los conglomerados deben ser muy homogéneos entre
si y al interior deben ser muy variables (recoger todas las características posibles de
la población.
3.3. Muestreos no aleatorios:
Este tipo de muestreos carecen de confiabilidad y tienen problemas de validez

externa por lo cual los resultados o estimaciones que se realizan a partir de ellos no
pueden generalizarse a la población de la cual provienen.
Muestreo por conveniencia, son las personas que van llegando a un sitio o servicio.
Muestreo por cascada o bola de nieve. Se contactan unas personas inicialmente y

estas refieren otros posibles candidatos (familiares, amigos, compañeros, etc.) a
encuestar o incluir en la medición.
Muestreo voluntario: se solicitan voluntarios para responder una encuesta o

participar de un estudio.
3.4. Calculo de tamaño de muestra
Se debe definir un nivel de confianza  previamente, cuando no se cuenta con

información anterior se puede usar  = 0.05, también un margen de error máximo
para la estimación que puede tomarse de estudios anteriores o definirse por el
investigador, lo recomendable es que sea inferior al ≤10% y se debe estimar la
varianza S2.
27
Tamaño de muestra para proporciones
Donde, pq es la varianza,  es el error máximo tolerable en la estimación.
Cuando la varianza es desconocida se asume p=0.5, el inconveniente es que al usar

esta probabilidad se maximiza el tamaño de la muestra.
Aplicación ver anexo.
28
ACTIVIDADES DE APRENDIZAJE
De acuerdo a los temas tratados en la Unidad II, realice de manera independiente

los siguientes ejercicios, posterior a la asesoría presencia o virtual de la Unidad se
publicarán las respuestas en el Campus Virtual, para que usted compare sus
respuestas.
Los ejercicios que se presentan a continuación le permitirán aplicar y reforzar los

conceptos revisados. Desarróllelos y compare sus respuestas con las que aparecerán
en el campus virtual en la fecha indicada.
1. En una IPS de nivel III de la ciudad de Cali en el año 2013 se realizó un

estudio para estimar la probabilidad de desarrollar pre-eclampsia y su relación
con el diagnóstico previo a la gestación, de hipertensión arterial; se obtuvo
una muestra de 400 mujeres primigestantes y los siguientes resultados:
PREECLAMPSIA
SI ( E ) NO ( K ) Total
ANTECEDENTE
Positivo (P) 63 19 82
HTA
Negativo (N) 10 308 318
Total 73 327 400
Considere los siguientes eventos:

P: {gestante con antecedente de HTA}
N: {gestante sin antecedente de HTA}
E: {con preemclampsia}
K: {sin preemclampsia}
Calcule las siguientes probabilidades conjuntas y marginales, luego responda las

siguientes preguntas:
a. ¿Probabilidad de tener preeclampsia?
b. ¿Probabilidad de no tener preeclampsia?
c. ¿Probabilidad de tener antecedente de HTA y tener preeclampsia?
d. ¿Probabilidad de presentar preeclampsia dado que NO tuvo el antecedente de
hipertensión arterial?
e. ¿Probabilidad de presentar preeclampsia dado que SI tuvo el antecedente de
hipertensión arterial?
29
2. En una ESE del municipio de Cali, se requería preparar el Informe de SISVAN

MATERNO; teniendo en cuenta que los puntos de corte para clasificar el
estado nutricional de la gestantes es:
Valor de corte IMC Clasificación

≤ 25 Bajo Peso
(25 a 28.9] Normal
(28.9 a 33] Sobrepeso
> 33 Obesidad
Se conoce que el IMC sigue una distribución normal, se obtuvo información de 3510
mujeres, el IMC promedio fue de 27.5 y la desviación estándar 3.1, calcule las
siguientes probabilidades:
a. Porcentaje de mujeres con IMC en rangos normales.

b. Porcentaje de mujeres con IMC inferiores a 25.
c. Porcentaje de mujeres con IMC superiores a 33
3. De acuerdo a los lineamientos del Ministerio de Salud se debe alcanzar

coberturas útiles de vacunación superiores a 95%, se desea verificar que esta
meta se esté cumpliendo en la comuna 13 de Cali. Para ello se requiere
estimar el tamaño de muestra teniendo en cuenta que el =0.05, el nivel de
confianza de la estimación =0,10 y con un estudio anterior la proporción de
éxito fue de p=0.8.
30
AUTOEVALUACIÓN.
La autoevaluación de esta unidad se construye a partir de los logros que usted

considera alcanzó, de acuerdo a su esfuerzo y compromiso.
Agradecemos enviarnos un correo en el cual manifieste la importancia de los

conceptos abordados en esta unidad para la comprensión de las labores diarias e
investigativas como la lectura de artículos de investigación, y otras inherentes a los
procesos de investigación.
31
Anexo 1
Distribución Chi-cuadrado
32
Anexo 2
Distribución t-Student
La t-Student se usa cuando se desea estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño n<30
Depende de un parámetro “grados de libertad” denotado como “V” o “gl”, el cual es igual a
n-1, /2, donde  es el nivel de significancia definido por el investigador, este se divide en
dos para obtener /2
33
BIBLIOGRAFÍA
Cruz, CA. Probabilidades y Muestreo. Unidad II. En: Asignatura de Biometría para la
Maestría en Enfermería, Dirección de Nuevas Tecnologías y Educación Virtual,
Universidad del Valle, 2008.
Downie M. R y Heath R. W. Métodos Estadísticos Aplicados. 3 Ed. México: Harla,

Harper y Row Latinoamericana. 1973
Walpole, Myers. Probabilidad y estadística para ingenieros. 3 Edición. Editorial

Interamericana. México. 1987.
Daniel, Wayne W. Bioestadística base para el análisis de las ciencias de la salud.

México. Editorial Limusa Wiley. 2002.
Beth, Dawson y Robert G., Trapp. Bioestadística médica. 4ta. Edición. Editorial Manual
moderno. Mexico, 2005.
Jay L. Devore, Probabilidad para ingeniería y ciencias.
34

00 - Guia Probabilidad Csociales

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

00 - Guia Probabilidad Csociales

Cargado por

Copyright:

Formatos disponibles

C. Mora.

Notas de clase Bioestadística,

UNIVERSIDAD DEL VALLE

Tema 1. Introducción a la Probabilidad

Elaboró: Claudia Patricia Mora

UNIDAD II. PROBABILIDAD Y MUESTREO ESTADÍSTICO

En la Unidad I los estudiantes tuvieron la oportunidad de conocer elementos básicos

En la presente unidad se abordarán conceptos relacionados con la probabilidad y

Con el tema 1 se estudiaran algunas situaciones en las que participan las

Con el tema 2 se identificarán algunos modelos o patrones en los cuales es

1. Reconocer los enfoques básicos de la teoría de probabilidades

En esta unidad se estudiarán tres temas principales relacionados con las

Tema 1: Introducción a la Probabilidad: Conceptos básicos de probabilidad,

Tema 2: Modelos de Probabilidad. Definiciones. Métodos de conteo: reglas de la

Tema 3: Muestreo estadístico. Definiciones de muestreo, tipos de muestreo, cálculo

TEMA 1. INTRODUCCIÓN A LA PROBABILIDAD

El estudio de la probabilidad como rama de las matemáticas se remonta a más de

El concepto de probabilidad es necesario cuando se desea investigar sobre sucesos

“El termino probabilidad se refiere al estudio de la aleatoriedad y la incertidumbre”.

1.1. Definiciones básicas

Experimento: cualquier acción o proceso que genera observaciones (o un conjunto

Es posible repetirlo varias veces sin cambiar esencialmente las condiciones.

Eventos colectivamente exhaustivos: Constan de todos los posibles resultados de

Ejemplo. El lanzamiento de un dado {1, 2, 3,4, 5, 6} es un evento colectivamente

Ejemplo: suponga que se desea estudiar el comportamiento de lanzar un dado para

Experimento: {Lanzar un dado}

Espacio muestral S: {1, 2, 3, 4, 5, 6}

Evento A:{lanzar y que salga impar}={1, 3, 5}

¿Cuál es la probabilidad de que ocurra el evento A?

1.2. Propiedades de probabilidad

Unión de dos eventos A y B, se denota A Ս B, es el evento formado por todos los

Intersección de dos eventos A y B, se denota A Ո B, es el evento formado por todos

Complemento de un evento A, se denota A’.

 Sean A, B y C tres eventos que pertenecen al espacio muestral S para calcular la

i). Para cualquier evento A, P(A) = 1- P(A`)  P(A`)= 1- P(A)

ii) La probabilidad de A y B (intersección)  P(A Ո B)= no. elementos en A y B /

iii) La probabilidad de A o B (unión)  P(A Ս B) se lee “probabilidad de A o B”

P(A U B) = P(A) + P(B) - P(A Ո B).

iv) La probabilidad de la unión de los eventos A, B y C  P(A U B U C), se lee” la

P(A U B U C)= P(A) + P(B) + P(C) – P(AՈB)- P(AՈC)- P(BՈC)+P(AՈBՈC)

v) La probabilidad de unión de los evento A y B cuando estos son mutuamente

P(A U B) = P(A) + P(B)

Ejemplo: La empresa Surticondor cuenta con 50 empleados de los cuales 20 incluyen en su

A:{personas que consumen leche}

Calcule las siguientes probabilidades:

a. La probabilidad de tomar leche dado que toma café

Probabilidad de que ocurra A  P(A) = 20/50 = 0.4

Probabilidad de que ocurra B  P(B) = 25/50 =0.5

Probabilidad de que ocurra C  P(C)=10/50=0.05

Probabilidad de que ocurra A y B P (AՈB) = 5/50= 0.1

Probabilidad de que ocurra A o B  P(AՍB) = P(A)+P(B) – P(AՈB)

Probabilidad de que ocurra B y C  P(B ՈC)= 0 (mutuamente excluyentes)

Probabilidad de que ocurra B o C  P(B ՍC)= P(B)+P(C)= 0.5+0.05= 0.55

Probabilidad de A’  P(A’) = 1 – P(A) = 1 – 0.4 = 0.6

Las probabilidades también se pueden representar en un diagrama de Venn, así:

La probabilidad total está dada por:

Para el empaque de leche en polvo en una reconocida empresa de lácteos se emplean 3

Las probabilidades dadas por el ejercicio son:

Por lo tanto, la probabilidad total de defectuosos es

En total el 4,2% de la producción sale defectuosa.

1.3. Enfoques de Probabilidad

1.2.1. Enfoque Empírico o “a Posteriori”

Se usa cuando el investigador no conoce previamente la probabilidad de que ocurra