Está en la página 1de 34

C. Mora.

Notas de clase Bioestadística,


Universidad del Valle, Colombia 2016

UNIVERSIDAD DEL VALLE


FACULTAD DE SALUD
PROGRAMAS DE POSTGRADO

Asignatura: BIOESTADÍSTICA
INVESTIGACIÓN

UNIDAD II

PROBABILIDADES Y MUESTREO

Tema 1. Introducción a la Probabilidad


Tema 2. Modelos de Probabilidad y aplicaciones
Tema 3. Distribución de Muestreo

Elaboró: Claudia Patricia Mora


Estadística, MSc. En Epidemiología
E-mail: claudia.mora@correounivalle.edu.co

Marzo, 2016

1
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

UNIDAD II. PROBABILIDAD Y MUESTREO ESTADÍSTICO

Presentación

En la Unidad I los estudiantes tuvieron la oportunidad de conocer elementos básicos


de la estadística descriptiva, distinguir los tipos de variables y sus escalas de
medición, construir e interpretar tablas de frecuencias, elaborar gráficos, diferenciar
entre población y muestra; calcular e interpretar diversos indicadores como las
medidas de tendencia central, de dispersión y de posición no central.

En la presente unidad se abordarán conceptos relacionados con la probabilidad y


teoría del muestreo como base fundamental para comprender la estadística
inferencial, aporta a los estudiantes de Biometría herramientas adicionales para la
aplicación de modelos de probabilidad en su ejercicio profesional.

Con el tema 1 se estudiaran algunas situaciones en las que participan las


probabilidades. Se realizaran algunos cálculos de probabilidad y se presentaran
propiedades en relación a la intersección, unión, complemento.

Con el tema 2 se identificarán algunos modelos o patrones en los cuales es


relativamente simple calcular las probabilidades. Para ilustrar el manejo se
mencionan los modelos, Binomial, Hipergeométrico y Poisson en el caso de variables
discretas y el modelo normal para el caso de variables continúas.

En el tema 3 se dan los elementos básicos para comprender la teoría del muestreo
estadístico haciendo mayor énfasis en los muestreos aleatorios.

Objetivos

1. Reconocer los enfoques básicos de la teoría de probabilidades


2. Identificar los modelos para el cálculo de probabilidades
3. Aplicar las distribuciones de probabilidad a problemas de la vida real
4. Identificar los diversos tipos de muestreo estadístico

Desarrollo de Contenidos:

En esta unidad se estudiarán tres temas principales relacionados con las


probabilidades y muestreo, así:

Tema 1: Introducción a la Probabilidad: Conceptos básicos de probabilidad,


probabilidad de la intersección, probabilidad condicional, probabilidad de la unión.

2
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Tema 2: Modelos de Probabilidad. Definiciones. Métodos de conteo: reglas de la


adición y multiplicación, permutación y combinaciones. Distribuciones de
probabilidad: distribuciones de probabilidad para variables cuantitativas discretas y
continuas, uso de tablas de probabilidad e interpretaciones. Teorema del Limite
Central.

Tema 3: Muestreo estadístico. Definiciones de muestreo, tipos de muestreo, cálculo


de muestreo aleatorio simple y métodos de selección de muestras aleatorias.

3
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

TEMA 1. INTRODUCCIÓN A LA PROBABILIDAD

El estudio de la probabilidad como rama de las matemáticas se remonta a más de


300 años, cuanto tuvo sus orígenes en preguntas de juegos de azar; sin embargo, en
el lenguaje cotidiano el termino probabilidad representa nuestra confianza en que
un suceso ocurrirá en el futuro, “mañana lo más probable es que llueva”, “lo más
probable es que se cure si sigue las indicaciones médicas”, “lo más probable es que
Pedro llegue puntual a la cita”.

El concepto de probabilidad es necesario cuando se desea investigar sobre sucesos


físicos, fenómenos naturales, biológicos o sociales que generan observaciones que
no pueden predecirse con certeza.

“El termino probabilidad se refiere al estudio de la aleatoriedad y la incertidumbre”.


Jay L. Devore, Probabilidad
para ingeniería y ciencias.

1.1. Definiciones básicas

Experimento: cualquier acción o proceso que genera observaciones (o un conjunto


de datos), presenta las siguientes características:

Es posible repetirlo varias veces sin cambiar esencialmente las condiciones.


Aunque no pueda decir con certeza cuál será el resultado, si se conocen todos los
posibles resultados.

Espacio Muestral: se denota con la letra mayúscula “S”, es el conjunto de todos los
posibles resultados de un experimento. (finito o infinito).

Evento ó suceso: es uno o más elementos del espacio muestral, se denotan con las
letras mayúsculas A, B, … C, también pueden denotarse como A1, A2, … An o B1, B2…
Bn.
Los eventos pueden ser simples o compuestos, los primeros hacen referencia a que
toma un solo elemento dentro del conjunto S, mientras que un evento compuesto
es un subconjunto dentro del espacio muestral.

Eventos colectivamente exhaustivos: Constan de todos los posibles resultados de


un experimento y constituyen ser el espacio muestral S.

Ejemplo. El lanzamiento de un dado {1, 2, 3,4, 5, 6} es un evento colectivamente


exhaustivo, ya que la probabilidad de unión de todos los eventos es 1.

4
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Ejemplo: suponga que se desea estudiar el comportamiento de lanzar un dado para


ello usted puede definir Experimento, Espacio Muestral (S) y los eventos.

Experimento: {Lanzar un dado}

Espacio muestral S: {1, 2, 3, 4, 5, 6}

Evento A:{lanzar y que salga impar}={1, 3, 5}

¿Cuál es la probabilidad de que ocurra el evento A?

𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 (𝐴)=3/6=0.5≈50%

Existe una probabilidad del 50% que al lanzar el dado se obtenga un número impar.

1.2. Propiedades de probabilidad

 Por regla general las probabilidades están dadas entre cero y uno.
 Pueden representarse como porcentajes para facilitar su interpretación
multiplicando por 100 la probabilidad.
 Un experimento que tiene un espacio muestral S y un número finito de
eventos se puede expresar como un diagrama de Venn.

Unión de dos eventos A y B, se denota A Ս B, es el evento formado por todos los


resultados que están en A ó B.

5
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Intersección de dos eventos A y B, se denota A Ո B, es el evento formado por todos


los resultados que están en A y B.

Complemento de un evento A, se denota A’.


El complemento del evento A es el conjunto de todos los resultados en S que no
están en A.

Mutuamente excluyentes.
Cuando A y B no tienen elementos o resultados en común, se dice que son eventos
mutuamente excluyentes o disjuntos.

6
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

 Sean A, B y C tres eventos que pertenecen al espacio muestral S para calcular la


probabilidad en cada caso:

i). Para cualquier evento A, P(A) = 1- P(A`)  P(A`)= 1- P(A)

ii) La probabilidad de A y B (intersección)  P(A Ո B)= no. elementos en A y B /


n
donde n es el número total de elementos de S.

iii) La probabilidad de A o B (unión)  P(A Ս B) se lee “probabilidad de A o B”


si los eventos no son mutuamente excluyentes, entonces P(A Ո B)≠0, por lo tanto,

P(A U B) = P(A) + P(B) - P(A Ո B).

iv) La probabilidad de la unión de los eventos A, B y C  P(A U B U C), se lee” la


probabilidad del evento A o B o C”, es

P(A U B U C)= P(A) + P(B) + P(C) – P(AՈB)- P(AՈC)- P(BՈC)+P(AՈBՈC)

v) La probabilidad de unión de los evento A y B cuando estos son mutuamente


excluyuentes, hay que tener en cuenta que P(A Ո B)=0, por lo tanto

P(A U B) = P(A) + P(B)

7
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Ejemplo: La empresa Surticondor cuenta con 50 empleados de los cuales 20 incluyen en su


desayuno un vaso de leche, otros 25 desayunan con café sin leche, hay 5 que desayunan café
con leche y 10 no incluyen ninguna de las dos bebidas, represente estos elementos en un
diagrama de Venn.

A:{personas que consumen leche}


B:{personas que consumen café}
C:{personas que no consumen ninguna de las bebidas}

Calcule las siguientes probabilidades:

a. La probabilidad de tomar leche dado que toma café


b. No tomar café
c. Probabilidad de tomar leche y cafe

8
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Probabilidad de que ocurra A  P(A) = 20/50 = 0.4

Probabilidad de que ocurra B  P(B) = 25/50 =0.5

Probabilidad de que ocurra C  P(C)=10/50=0.05

Probabilidad de que ocurra A y B P (AՈB) = 5/50= 0.1

Probabilidad de que ocurra A o B  P(AՍB) = P(A)+P(B) – P(AՈB)


P(AՍB) = 0.4+0.5-0.1= 0.8

Probabilidad de que ocurra B y C  P(B ՈC)= 0 (mutuamente excluyentes)

Probabilidad de que ocurra B o C  P(B ՍC)= P(B)+P(C)= 0.5+0.05= 0.55

Probabilidad de A’  P(A’) = 1 – P(A) = 1 – 0.4 = 0.6

Las probabilidades también se pueden representar en un diagrama de Venn, así:

Nota: se inicia poniendo la intersección de todos los conjuntos, se resta la intersección a los
conjuntos que la contienen.

Probabilidad Total
Si un espacio muestral S, se divide según criterios de partición:
a) La unión de los diferentes segmentos es igual al espacio muestral S.

B1 Ս B2 Ս B3,…, Ս Bn = S
b) Los segmentos son mutuamente excluyentes, es decir Bi Ո Bj =0 para todo i y j.

La probabilidad total está dada por:

9
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Ejemplo.

Para el empaque de leche en polvo en una reconocida empresa de lácteos se emplean 3


máquinas que producen: MQ1=50%, MQ2=30% y MQ3=20% de la producción total. Los
defectos en cada máquina son 4%, 4% y 5%. Si se va a empacar la siguiente bolsa de leche
en polvo ¿Cuál es la probabilidad total de que la próxima bolsa de leche sea empacada de
manera defectuosa?.

Solución:
Se deben definir claramente cuáles son los eventos
A:{que sea defectuoso}
B1:{que sea producido por la MQ1}
B2:{que sea producido por la MQ2}
B3:{que sea producido por la MQ3}
A/B1:{defectuoso, producido por MQ1}
A/B2:{defectuoso, producido por MQ2}
A/B3:{defectuoso, producido por MQ3}

Las probabilidades dadas por el ejercicio son:


P(B1)=0,5 P(B2)=0,3 P(B3)=0,2
P(A/B1)=0,04 P(A/B2)=0,04 P(A/B3)=0,05

Por lo tanto, la probabilidad total de defectuosos es

P(A)=0,5*0,04+0,3*0,04+0,2*0,05=0,042

En total el 4,2% de la producción sale defectuosa.

1.3. Enfoques de Probabilidad

Dependiendo del tipo de problema se debe tener en cuenta que se debe usar el
enfoque que responda a las condiciones de cada situación, se tienen los siguientes
enfoques: el empírico o “a Posteriori”, el teórico y el subjetivo.

1.2.1. Enfoque Empírico o “a Posteriori”

Se usa cuando el investigador no conoce previamente la probabilidad de que ocurra


un suceso.

10
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Ejemplo: Se desea saber ¿cuál es la probabilidad de que una persona seleccionada


al azar de la comuna 18 de Cali sea fumadora?.

Para ello se tomó una muestra de 500 personas


mayores de 15 años de la comuna 18 de Cali,
logrando identificar si fuman o no.

Fumadores ni hi
Sí 125 0.25
No 375 0.75
Total 500 1.00

Estas frecuencias, se pueden aproximar a probabilidades si se garantiza que la


muestra fue seleccionada al azar, de tal manera que si se escoge una persona al azar
de esta comuna de Cali, la probabilidad de que sea fumador es del 0.25 o 25%.

1.2.2. Enfoque teórico o “a priori”

Este enfoque implica la determinación de la probabilidad de algún evento antes de


que ocurra, se relaciona con mayor frecuencia con las apuestas y juegos de azar. Se
conocen todos los posibles resultados del experimento.

Ejemplo: Cuando el experimento es “lanzar un dado y registrar el puntaje de la cara


superior”, se puede considerar (supuesto) que todos los resultados son igualmente
probables y entonces la probabilidad de obtener “5” sería 1/6.

Numero de resultados favorables al evento A


P( A) 
Número total de resultados
1
P(5) =
6

1.2.3. Enfoque subjetivo:

Se utiliza cuando se desea asignar una probabilidad a un suceso que nunca ha


ocurrido o cuando no sea posible repetir el experimento bajo condiciones
semejantes, ni asignar probabilidades en forma teórica, se debe utilizar a un experto
en el tema quien asignará con un criterio personal o subjetivo (a partir de su
experiencia, condiciones del paciente, del entorno, etc.) la probabilidad de
determinado evento.

11
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Ejemplo: un médico dice a su paciente que la probabilidad de éxito en la cirugía


puede ser del 80%.

1.4. Probabilidades marginal y condicional

1.4.1. Probabilidad condicional

La probabilidad condicional es el cálculo de la probabilidad de que un evento ocurra


dado que otro evento ya ocurrió.

Suponga que tiene dos eventos A y B que pertenecen al espacio muestral S, el evento
A ya ocurrió y “la probabilidad de B dado que A ya ocurrió” se expresaría como
“ P( B A) ”

Para calcular la probabilidad condicional se usa la siguiente expresión matemática:

P( B  A)
P( B A) 
P( A)
Siempre que P(A) >0

También se puede obtener la “probabilidad de A dado que B ya ocurrió” se


expresaría como “ P( A B) ” y se calcula:

P( A  B)
P( A B) 
P( B)
Siempre que P(B) >0

Propiedad:
La probabilidad de intersección A y B se puede obtener P(AՈB) = P(A)*P(BA)

1.4.2. Probabilidades marginales y conjuntas

Si se dispone de los datos en una tabla de 2x2 (tabla de contingencia), se divide cada
valor de la tabla por el total y se obtienen las probabilidades marginales en los
bordes de la tabla y las probabilidades conjuntas o intersecciones dentro de la tabla.

Ejemplo: en un laboratorio clínico se dispone de prueba para virus respiratorios por


InmunoFlurencencia Indirecta (IFI), se cuenta con dos bacteriólogas para el análisis
de las muestras, los 240 resultados del mes de febrero son:

12
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Para calcular las probabilidades conjuntas y marginales se dividen todos los


elementos por el total de la tabla, en este caso n=240 resultados de laboratorio (240
pacientes), obteniendo la siguiente tabla de probabilidades:

Hay que tener en cuenta que cada fila y columna de la tabla es un evento, por lo
tanto, se tienen 4 eventos:

P: {la prueba IFI es positiva}


N: {la prueba IFI es negativa}
A: {la bacterióloga A es la que analiza la muestra}
B: {la bacterióloga B es la que analiza la muestra}

Las probabilidades conjuntas son las mismas probabilidades intersección de los


eventos, mientras que las probabilidades marginales corresponden a la ocurrencia
de uno de los eventos en particular.

Probabilidades marginales:
P(P) = 0.54  El 54% de las muestras fueron positivas para virus respiratorios.
P(N) = 0.46  El 46% de las muestras fueron negativas para virus respiratorios.
P(A) = 0.42  El 42% de las muestras fueron analizadas por la bacterióloga A
P(A) = 0.48  El 48% de las muestras fueron analizadas por la bacterióloga B

Las probabilidades conjuntas:

13
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

A partir de las probabilidades obtenidas en la tabla de contingencia es posible


calcular probabilidades condicionales, Si se escoge al azar uno de los pacientes y se
encuentra que su resultado es negativo, ¿Cuál es la probabilidad de que haya sido
analizado por la bacterióloga A?

La probabilidad de que la muestra la haya analizado la bacterióloga A dado que el


resultado fue Negativo (N) es 0,28 (en porcentaje 28%).

Eventos independientes:
Si los eventos A y B son independientes, es decir, la ocurrencia de uno no afecta la
probabilidad de ocurrencia del otro

Sea A y B dos eventos definidos en el espacio muestral S, si son independientes,


entonces
P(AՈB)= P(A) * P (B)

Entonces, P(A I B) = P(A) y P(B I A) = P(B)

Ejemplo: la probabilidad de que un esposo y una esposa estén vivos en 20 años son
P(H)=0.8 y P(F)=0.9 respectivamente, suponga que estos son eventos
independientes.

Hallar:
a) la probabilidad de que en 20 años ambos vivan,
P(ambos vivos)= P(H Ո F) = P(H)*P(F)=0.8*0.9=0.72

b) ninguno viva.
P(ninguno viva) = P(H´)*P(F´)=0.2*0.1=0.02

1.5. Teorema de Bayes

El teorema de Bayes fue una proposición planteada por el matemático, filósofo y


ministro presbiteriano inglés Thomas Bayes (1702-1761).

14
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Sea {A1, A2,…, Ai,…An} un conjunto de sucesos


mutuamente excluyentes y exhaustivos, tales que la
probabilidad de cada uno de ellos es distinta de cero (0).
Sea B un suceso cualquiera del que se conocen las
probabilidades condicionales P(B I Ai). Entonces, la
probabilidad P(Ai I B) viene dada por la expresión:

Donde,

 P(Ai) son las probabilidades a priori


(conocidas),
 P(B I Ai) es la probabilidad de B en la hipótesis Ai,

 P(Ai I B) son las probabilidades a posteriori (no ocurrida).

La formula de Bayes es:

Ejemplo: continuando con el ejemplo visto en probabilidad condicional, en el cual


para el empaque de leche en polvo en una reconocida empresa de lácteos se emplean 3
máquinas que producen: MQ1=50%, MQ2=30% y MQ3=20% de la producción total. Los
defectos en cada máquina son 4%, 4% y 5%. Se escoge al azar una bolsa y esta resulta
defectuosa. ¿Cuál es la probabilidad de que haya sido producida por la MQ1?.

A: {bolsa de leche defectuosa}


B1:{Que sea empacado por MQ1}
P(A)=0.042 (probabilidad total)
P(A/B1)=0.04

P(B1/A)=(0.5)*(0.04)/[(0.5*0.04)+(0.3*0.04)+(0.2*.05)]=0,476

15
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

La probabilidad de que una bolsa de leche en polvo seleccionada al azar sea


empacada de manera defectuosa y haya sido producida por la MQ1, es del 47.6%

16
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

TEMA 2. MODELOS DE PROBABILIDAD

El comportamiento de una variable aleatoria puede describirse a través de un


modelo de probabilidad, el cual es una función matemática que permite estimar la
posibilidad de que la variable tome un valor específico, es decir, su distribución de
probabilidad.

En la actualidad se cuenta con grandes avances en el desarrollo de modelos de


probabilidad que explican las variables cuantitativas tanto discretas como continuas,
en casos excepcionales un investigador tendrá que desarrollar su propio modelo
para explicar el comportamiento de sus variables.

Para las variables cuantitativas discretas los modelos de probabilidad más usados
son las Distribuciones Binomial, Multinomial, Hipergeométrica y Poisson; para el
caso de variables cuantitativas continuas los modelos de probabilidad son las
Distribuciones Chi-cuadrado, Exponencial, Gamma, T-Student y Normal estándar. La
ventaja de que la variable aleatoria de interés se distribuya según los modelos
mencionados consiste en que ya cuentan con las fórmulas para el cálculo de la
probabilidad e incluso tablas donde ya están calculadas estas.

2.1. Distribución Binomial.

Esta distribución fue ideada para variables cuantitativas discretas. Se deben tener 3
elmentos para su calculo que son: el tamaño de la muestra “n”, la probabilidad de
éxito “p” y la probabilidad de fracaso (no éxito) “q”, donde q=1-p.

La formula para calcular la probabilidad de que la variable X tome un valor particular


“x” es:

n
P( X  x)    p x q n x
 x

Condiciones para el uso del modelo Binomial:


• n ensayos u observaciones
• Sólo dos posibles resultados Éxito y Fracaso
• Probabilidad de Éxito constante en cada ensayo
• Resultados independientes

Ejemplo: La probabilidad de que un paciente se recupere de una enfermedad rara


en la sangre es de 0.4.
Si se sabe además que en Cali hay 15 personas con esta enfermedad.
¿Cuál es la probabilidad de que sobrevivan 5 personas?

17
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Solución:
La variable X en este caso sería el número de personas que sobreviven a la
enfermedad, la probabilidad de éxito es p=0.4 y la probabilidad de fracaso es q=0.6,
n=15

Usando la formula matemática sería:


n
P( X  x)    p x q n x
 x

15 
P( X  5)   (0.4)5 (0.6)155
5 

P( X  5)  0.1859

La probabilidad de que 5 personas con la enfermedad rara en la sangre de Cali


sobrevivan es del 18.59%

Cuando se requiere calcular la probabilidad acumulada, es decir cuando la


variable X es menor o igual a un valor determinado k P(X≤ k), esto se puede enunciar
como “probabilidad de que X tome como máximo el valor k” o esta se calcula de la
siguiente forma:

P(X≤ k) = P(X=0) + (PX = 1) + …. + P(X =k)

Continuando con el ejemplo, ¿cuál es la probabilidad de que sobrevivan como


máximo 5 personas?.

P(X ≤ 5) = P(X=0) + (PX = 1) + P(X =2) + P(X =3) + P(X =4)+ P(X =5)
15 
P( X  0)   (0.4) 0 (0.6)150 = 0.00047
0 

15 
P( X  1)   (0.4)1 (0.6)151 = 0.0047
1 

15 
P( X  2)   (0.4) 2 (0.6)152 = 0.0219
2 

18
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

15 
P( X  3)   (0.4)3 (0.6)153 = 0.0634
3 

15 
P( X  4)   (0.4) 4 (0.6)154 =0.1268
4 

15 
P( X  5)   (0.4)5 (0.6)155 =0.1859
5 

Finalmente, se deben sumar los resultados de las probabilidades puntuales y se


obtiene la probabilidad requerida

P(X ≤ 5) = 0.00047+0.0047+0.0219+0.06234+0.1268+0.1859
P(X ≤ 5) = 0.4032

La probabilidad de que sobrevivan como máximo 5 personas es del 40.32%.

Estas probabilidades también se pueden calcular usando la tabla de la distribución


acumulada de la Binomial.

Método usando la tabla de Distribución

19
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

20
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

2.1. Distribución Chi-cuadrado

Esta distribución se utiliza para inferencia estadística para evaluar la independencia o


asociación de variables cualitativas, para el cálculo de los intervalos de confianza para
la varianza, los cuales se tratarán en detalle en la Unidad de Inferencia Estadística de
este curso.
Tabla de puntos críticos - Anexo 1

2.2. Distribución t-Student

Ver anexo 2

2.3. Distribución Normal

Conocida también como distribución gaussiana en honor a


su inventor Carl Friedrich Gauss. Matemático Alemán
(1777-1855)

Es utilizada para variables cuantitativas continuas, tiene


múltiples aplicaciones en diversos campos del
conocimiento:

Teoría Six Sigma – Control de Calidad industrial


Indicadores antropométricos
Comportamiento del peso al nacer
Glicemia en sangre
Evaluación de aprendizaje (Educación)
Evaluación de mercados competitivos

En el eje x se ubicará la variable cuantitativa de interés en el eje vertical y la


probabilidad p(x)

P(x)

21
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Se debe transformar la variable X en una nueva variable Z la cual se obtiene con la


siguiente formula:

x
z

La variable original X con una media particular μ y una varianza σ2, ahora se obtuvo
una variable transformada Z la cual tiene μ=0 y varianza σ2=1.

Propiedades:
1. Asintótica, es decir la distribución normal no corta el eje X (eje horizontal), es
decir, se mueve entre menos infinito y más infinito.
2. Simetría, la distribución es simétrica con relación a su media.
3. La distribución normal sólo se usa para variables cuantitativas continuas.

Ejemplo. En Cali en el año 2015 nacieron 27560 niños con madres residentes en el
municipio, el peso al nacer en promedio es de 3150 gramos y tiene una desviación
estándar de 400 gramos, se sabe también que el peso al nacer sigue una distribución
normal.

¿Cuál es la probabilidad de que nazcan niños con Bajo Peso (inferior a 2500 gramos?

Sea X la variable peso al nacer  P( X  2500)  ?

Respuesta:

22
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

x
Se estandariza la variable X a la Z a través de la expresión z 

P( X  2500)  ?
𝑋 − 𝜇 2500 − 3150
𝑃( ≤ ) = 𝑃(𝑍 ≤ −1,63)
𝜎 400

Se ubica en la tabla normal

Por lo cual se sabe que la probabilidad de que un niño tenga un peso inferior a 2500
gramos es del 5.155%

23
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Se debe tener presente que la tabla de probabilidad genera un área hacia el lado
izquierdo del corte que se le haga a la campana, ahora nos interesa conocer la
probabilidad de obtener niños con pesos mayores a 3600 gramos.

P(X> 3600)=?

Solución:
P(X> 3600)= 1-P(X<3600) esto gracias a la propiedad de que toda el área bajo la
campana equivale a una probabilidad de 1.

µ=3150 3600 X: peso al nacer en gramos

𝑋 − 𝜇 3600 − 3150
𝑃( ≤ ) = 𝑃(𝑍 ≤ 1,13)
𝜎 400

Ubicamos el z= 1,13 en la tabla de probabilidad y obtenemos que la probabilidad


es 0,87076

P(X> 3600)= 1-P(z<3600) = 1 – 0.87076 = 0,12924

La probabilidad de que nazcan niños con pesos superiores a 3600 gramos es


12.924%

 Probabilidad entre dos valores


Ahora nos interesa saber la probabilidad de que nazcan niños con pesos
entre 2500 y 3600 (peso normal o adecuado) en Cali.
P(2500<X<3600)=?

Solución:
P(a<X<b)=P(x<b)-P(x<a)

P(2500≤X≤3600)=P(x≤b)-P(x≤a)

24
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

P(2500≤X≤3600) = P(X≤3600) - P(X≤2500)

Estas dos ultimas ya las podemos obtener de la tabla:

P(Z≤1,13) - P(X≤-1,63) = 0.87076 - 0.05155 = 0.81921

La probabilidad de tener niños con pesos entre 2500 y 3600 gramos es del 81.921%

Ejercicios de práctica.

a. Cual es la probabilidad de que nazcan niños con pesos inferiores a 2800


gramos?
b. Cual es la probabilidad de niños con pesos superiores a 4000 gramos?
c. Cual es la probabilidad de niños con pesos entre 2800 y 4000 gramos?
d. Ver ejercicio final en actividades de aprendizaje al final del capitulo.

25
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

TEMA 3. MUESTREO ESTADÍSTICO

Para medir ciertas características o atributos de una población por efectos de tiempo
y disponibilidad de recursos económicos no es posible realizar un censo del total de
individuos de una región o lugar (institución, viviendas, escuelas, etc.), por lo cual se
toman muestras o parte de los sujetos para realizar las mediciones; hay dos tipos de
muestreos los probabilísticos (aleatorios) y los no probabilísticos (no aleatorios).

3.1. Definiciones

Población: conjunto de todos los elementos de interés en un problema dado. Sin


embargo por situaciones prácticas, es poco posible que tengamos acceso a todos
los elementos de la población no solamente para su estudio sino para seleccionar
elementos de dicha población.

Población objetivo: son todos los individuos que cumplen con los criterios de
inclusión del estudio para ser elegibles dentro de la muestra.

Marco muestral: es el listado de los elementos de la población que sí se encuentran


disponibles para ser seleccionados en una muestra. Por ejemplo, si el estudio es
sobre escolares en Cali, no es tan factible poder tener un listado con los nombres de
todos los escolares de la ciudad, pero puede tenerse una lista de colegios del
municipio, de los cuales se han de seleccionar algunos.
En los colegios seleccionados se cuentan con listados de los grupos y sus
estudiantes, los cuales también serían marcos muestrales, de estos finalmente se
seleccionan los individuos sobre los que se realiza la medición.

Unidad de observación: es el individuo u objeto sobre el cual directamente se


realiza la medición.

Unidad de muestreo: es el área dentro de la cual está la o las unidades de


observación, por ejemplo: unidad de muestreo pueden ser viviendas y las unidades
de observación son mujeres embarazadas que habitan en ellas.

3.2. Tipos de Muestreos aleatorios:

Son muy recomendados cuando se desea extrapolar los resultados a la población de


la cual provienen.

3.2.1. Muestreo Aleatorio Simple (MAS):


Es el tipo de muestreo más comúnmente usado, se caracteriza porque es posible
establecer la probabilidad de extracción de cada elemento de la población, es la

26
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

técnica de muestreo más aconsejable, aunque en ocasiones no es posible optar por


él, es la base de todos los muestreos aleatorios.

3.2.2. Muestreo estratificado: este tipo de muestreo es utilizado para casos donde
no se pueden juntar los subgrupos de la población porque hay variables que
aumentan la variabilidad. Por ejemplo el IMC de una población adulta, es necesario
estratificar la muestra para hombres y para mujeres dado que este indicador es
diferente según el sexo.

3.2.3. Muestreo por conglomerados: este tipo de muestreo se utiliza para


aprovechar grupos que están conformados previamente, confinados o por la
actividad social están en un mismo lugar. Ejemplo: conglomerado puede ser las
escuelas oficiales y los sujetos a medir son los estudiantes de primaria, para estimar
indicadores antropométricas entre los 5 a 10 años. Es muy recomendable porque
facilita el trabajo de campo y la recolección, pero hay que tener mucho cuidado al
momento de la selección de los conglomerados deben ser muy homogéneos entre
si y al interior deben ser muy variables (recoger todas las características posibles de
la población.

3.3. Muestreos no aleatorios:

Este tipo de muestreos carecen de confiabilidad y tienen problemas de validez


externa por lo cual los resultados o estimaciones que se realizan a partir de ellos no
pueden generalizarse a la población de la cual provienen.

Muestreo por conveniencia, son las personas que van llegando a un sitio o servicio.

Muestreo por cascada o bola de nieve. Se contactan unas personas inicialmente y


estas refieren otros posibles candidatos (familiares, amigos, compañeros, etc.) a
encuestar o incluir en la medición.

Muestreo voluntario: se solicitan voluntarios para responder una encuesta o


participar de un estudio.

3.4. Calculo de tamaño de muestra

Se debe definir un nivel de confianza  previamente, cuando no se cuenta con


información anterior se puede usar  = 0.05, también un margen de error máximo
para la estimación que puede tomarse de estudios anteriores o definirse por el
investigador, lo recomendable es que sea inferior al ≤10% y se debe estimar la
varianza S2.
27
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Tamaño de muestra para proporciones

Donde, pq es la varianza,  es el error máximo tolerable en la estimación.

Cuando la varianza es desconocida se asume p=0.5, el inconveniente es que al usar


esta probabilidad se maximiza el tamaño de la muestra.

Aplicación ver anexo.

28
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

ACTIVIDADES DE APRENDIZAJE

De acuerdo a los temas tratados en la Unidad II, realice de manera independiente


los siguientes ejercicios, posterior a la asesoría presencia o virtual de la Unidad se
publicarán las respuestas en el Campus Virtual, para que usted compare sus
respuestas.

Los ejercicios que se presentan a continuación le permitirán aplicar y reforzar los


conceptos revisados. Desarróllelos y compare sus respuestas con las que aparecerán
en el campus virtual en la fecha indicada.

1. En una IPS de nivel III de la ciudad de Cali en el año 2013 se realizó un


estudio para estimar la probabilidad de desarrollar pre-eclampsia y su relación
con el diagnóstico previo a la gestación, de hipertensión arterial; se obtuvo
una muestra de 400 mujeres primigestantes y los siguientes resultados:

PREECLAMPSIA
SI ( E ) NO ( K ) Total
ANTECEDENTE

Positivo (P) 63 19 82
HTA

Negativo (N) 10 308 318

Total 73 327 400

Considere los siguientes eventos:


P: {gestante con antecedente de HTA}
N: {gestante sin antecedente de HTA}
E: {con preemclampsia}
K: {sin preemclampsia}

Calcule las siguientes probabilidades conjuntas y marginales, luego responda las


siguientes preguntas:
a. ¿Probabilidad de tener preeclampsia?
b. ¿Probabilidad de no tener preeclampsia?
c. ¿Probabilidad de tener antecedente de HTA y tener preeclampsia?
d. ¿Probabilidad de presentar preeclampsia dado que NO tuvo el antecedente de
hipertensión arterial?
e. ¿Probabilidad de presentar preeclampsia dado que SI tuvo el antecedente de
hipertensión arterial?

29
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

2. En una ESE del municipio de Cali, se requería preparar el Informe de SISVAN


MATERNO; teniendo en cuenta que los puntos de corte para clasificar el
estado nutricional de la gestantes es:

Valor de corte IMC Clasificación


≤ 25 Bajo Peso
(25 a 28.9] Normal
(28.9 a 33] Sobrepeso
> 33 Obesidad

Se conoce que el IMC sigue una distribución normal, se obtuvo información de 3510
mujeres, el IMC promedio fue de 27.5 y la desviación estándar 3.1, calcule las
siguientes probabilidades:

a. Porcentaje de mujeres con IMC en rangos normales.


b. Porcentaje de mujeres con IMC inferiores a 25.
c. Porcentaje de mujeres con IMC superiores a 33

3. De acuerdo a los lineamientos del Ministerio de Salud se debe alcanzar


coberturas útiles de vacunación superiores a 95%, se desea verificar que esta
meta se esté cumpliendo en la comuna 13 de Cali. Para ello se requiere
estimar el tamaño de muestra teniendo en cuenta que el =0.05, el nivel de
confianza de la estimación =0,10 y con un estudio anterior la proporción de
éxito fue de p=0.8.

30
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

AUTOEVALUACIÓN.

La autoevaluación de esta unidad se construye a partir de los logros que usted


considera alcanzó, de acuerdo a su esfuerzo y compromiso.

Agradecemos enviarnos un correo en el cual manifieste la importancia de los


conceptos abordados en esta unidad para la comprensión de las labores diarias e
investigativas como la lectura de artículos de investigación, y otras inherentes a los
procesos de investigación.

31
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Anexo 1
Distribución Chi-cuadrado

32
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

Anexo 2
Distribución t-Student
La t-Student se usa cuando se desea estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño n<30

Depende de un parámetro “grados de libertad” denotado como “V” o “gl”, el cual es igual a
n-1, /2, donde  es el nivel de significancia definido por el investigador, este se divide en
dos para obtener /2

33
C. Mora. Notas de clase Bioestadística,
Universidad del Valle, Colombia 2016

BIBLIOGRAFÍA

Cruz, CA. Probabilidades y Muestreo. Unidad II. En: Asignatura de Biometría para la
Maestría en Enfermería, Dirección de Nuevas Tecnologías y Educación Virtual,
Universidad del Valle, 2008.

Downie M. R y Heath R. W. Métodos Estadísticos Aplicados. 3 Ed. México: Harla,


Harper y Row Latinoamericana. 1973

Walpole, Myers. Probabilidad y estadística para ingenieros. 3 Edición. Editorial


Interamericana. México. 1987.

Daniel, Wayne W. Bioestadística base para el análisis de las ciencias de la salud.


México. Editorial Limusa Wiley. 2002.

Beth, Dawson y Robert G., Trapp. Bioestadística médica. 4ta. Edición. Editorial Manual
moderno. Mexico, 2005.

Jay L. Devore, Probabilidad para ingeniería y ciencias.

34

También podría gustarte