Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribucion Binomial
Distribucion Binomial
Mario Briones L.
MV, MSc
2005
DISTRIBUCION BINOMIAL
par-impar
aprueba-reprueba
vivo-muerto
preñada-seca
presente-ausente
positivo-negativo
hembra-macho
p+q=1
Al muestrear, a cada observación que cae en la clase
de interés primario se le llama éxito.
En una muestra de tamaño n la probabilidad de obtener 0,
1, 2, 3..., n éxitos se calcula fácilmente a través
de la distribución llamada binomial o de Bernoulli
Si r miembros de una muestra de tamaño n
poseen un determinado atributo, el estimador
muestreal de la proporción de la población que
posee este atributo es
p= r/n.
RECUERDE QUE UNA VARIABLE ES UN ATRIBUTO QUE
PUEDE SER DIFERENTE ENTRE INDIVIDUOS
MEDIA Y DESVIACION ESTANDAR DE UNA
VARIABLE BINOMIAL
y q=1-p
MEDIA Y DESVIACION ESTANDAR DE UNA
VARIABLE BINOMIAL
0 q -p
1 p 1 - p= q
p q s2 s
0 1 0 0.00
Relación entre 0.1 0.9 0.09 0.30
frecuencia y 0.2 0.8 0.16 0.40
0.3 0.7 0.21 0.46
desviación 0.4 0.6 0.24 0.49
estándar en 0.5 0.5 0.25 0.50
una distribución 0.6 0.4 0.24 0.49
0.7 0.3 0.21 0.46
binomial 0.8 0.2 0.16 0.40
0.9 0.1 0.09 0.30
1 0 0 0.00
VARIANZA Y DESVIACION ESTANDAR DE
UNA VARIABLE BINOMIAL
Estimación a partir de una muestra binomial
de tamaño n
= np 2 = npq = npq
Proporción
muertos p1=0.1097 p2=0.1343 p=0.1164
Al observar la diferencia entre los porcentajes de
mortalidad de los grupos de fumadores y no
fumadores...
Es una diferencia real o surge de error de muestreo?
COMPROBACION DE HIPÓTESIS:
HIPOTESIS NULA:
HIPOTESIS ALTERNA:
p1 - p2
z=
pq (1/n1 +1/n2)
Observado Observado
Esperado
Muertos 117 54 171
124.2
Observado Observado
Observado Observado
Esperado Esperado
Muertos 117 54 171
124.2 46.8
Observado Observado
Observado Observado
Esperado Esperado
Muertos 117 54 171
124.2 46.8
Observado Observado
Esperado
Vivos 950 348 1298
942.8
Observado Observado
Esperado Esperado
Muertos 117 54 171
124.2 46.8
Observado Observado
Esperado Esperado
Vivos 950 348 1298
942.8 355.2
X
2 observado esperado 2
esperado
Probabilidad
grados de libertad 0.1 0.05 0.01 0.005 0.001
1 2.706 3.841 6.635 7.879 10.827
2 4.605 5.991 9.210 10.597 13.815
3 6.251 7.815 11.345 12.838 16.266
4 7.779 9.488 13.277 14.860 18.466
5 9.236 11.070 15.086 16.750 20.515
6 10.645 12.592 16.812 18.548 22.457
7 12.017 14.067 18.475 20.278 24.321
En el ejemplo:
=1.726
En el ejemplo:
Conclusión:
= 1.641
Tamaño de muestra para
describir una variable binomial
Al igual que en el caso de una
variable cuantitativa, el tamaño
apropiado para describir una
proporción depende de:
La variabilidad de la característica.
Del grado de error admisible para el
estimador.
Tamaño de muestra para
describir una variable binomial
Al igual que en una variable cuantitativa,
el tamaño apropiado se deriva de la
magnitud deseada para el intervalo de
confianza, con una probabilidad
determinada, y se despeja n
4 p q
n0 2
L
donde L es el error admisible
Para una población de gran tamaño
Tamaño de muestra para
describir una variable binomial
Se debe tener una ´”aproximación”
a lo que son los valores de p y q en
la población, de modo de tener un
valor de pxq que es la varianza.
Tamaño de muestra para
describir una variable binomial
Si la población disponible es
pequeña, entonces la fórmula se
corrige y se ajusta n0
n0
n
n0
1
N
Ejemplo:
¿Cuál será el tamaño mínimo de
muestra para describir el porcentaje
de perros de la raza ovejero alemán,
afectados por displasia de cadera en
Chile?
Pasos:
1: Estimación previa del porcentaje
esperado.
Antecedentes de literatura
Estudios previos del mismo equipo de
investigación, etc.
Supongamos que por los puntos
anteriores se puede establecer que el
porcentaje será de un 30%
Pasos
2: Determinación de la magnitud del
error admisible
Depende de los objetivos del estudio
Ej. Error admisible, 5%
Pasos
3: Cálculo del tamaño mínimo
4 p q
n0 2
L
n0= (4 x 0.3 x 0.7)/0.05
n0= 0.84/0.0025
n0= 336 perros
Pasos:
4: Ajuste para población finita: suponiendo
que la población de perros Ovejero Alemán
en Chile es de 5000 ejemplares (N):
n0
n
n0
1
n=336/(1+(336/5000)) N
n=336/(1+0.0672)
n=314.8 = 315 perros
n0
n
n0
1
N
Debido a que la expresión en el
denominador de la fórmula para
ajuste del tamaño será más parecida
a 1 en la medida que el tamaño de
la población se hace más grande, el
mayor efecto en el ajuste se
produce cuando el tamaño de la
población disponible es pequeño.
Tamaño mínimo de la muestra
para comparar dos proporciones
Se aplican los mismos principios que
en la comparación de dos
promedios. Es decir, el tamaño
depende de la diferencia buscada
entre los porcentajes y la
probabilidad de encontrar esa
diferencia en el experimento (poder
de la prueba)
Tamaño mínimo de la muestra
para comparar dos proporciones
Para dos muestras independientes:
( Z Z ) ( p1q1 p2 q2 )
2
n
( p2 p1 ) 2
Donde
Z= desviación normal para el nivel de significancia
utilizado
= 2(1-P´)
Z= desviación normal correspondiente a la
probabilidad de dos colas de
Usar la mejor estimación de p 1q1+ p2q2
Ejemplo:
Suponga que existe un antibiótico
estándar que proteje a alrededor del
50% de los animales experimentales
contra una infección. Se obtiene un
nuevo antibiótico que parece ser
superior.
Ejemplo:
Al comparar el nuevo antibiótico con
el estándar los investigadores
desearía una probabilidad P´ de 0.9
de encontrar una diferencia, en una
prueba de una cola al nivel de
significancia de 0.05, si el nuevo
antibiótico proteje al 80% de los
animales en la población.
colas
Dos colas Una Cola
Poder 0.01 0.05 0.10 0.01 0.05 0.10
0.80 11.7 7.9 6.2 10.0 6.2 4.5
0.90 14.9 10.5 8.6 13.0 8.6 6.6
0.95 17.8 13.0 10.8 15.8 10.8 8.6
n=(8.6)[(0.5)(0.5)+(0.8)(0.2)]/0.32= 39.2
P1 q1 p2 q2 p2-p1
Observaciones
Unos cuantos cálculos de este tipo
nos harán ver rápidamente la triste
realidad: se necesitan grandes
tamaños de muestra para detectar
diferencias pequeñas entre dos
porcentajes.
Ejemplo2:
El tamaño de muestra fue crítico en
la planificación de la prueba de la
vacuna de Salk contra la
poliomielitis, ya que era muy
improbable poder repetir la prueba y
porque sería obviamente necesaria
una muestra de gran tamaño
Ejemplo 2:
Un supuesto utilizado fue:
Probabilidad de contraer polio en un niño no
vacunado= 0.0003 (0.03%)
Efectividad estimada de la vacuna= 50%
(disminución de la probabilidad a 0.00015
(0.015%)
P´= 0.9
= 0.05
¿cuántos niños serían necesarios en cada
grupo de prueba, con dos colas en la Ha?
Resp.: 210.000 niños.