Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La Binomial
Probabilidades Binomiales p = 0,5 e Histograma.
Diferencias en probabilidades Binomial y Normal.
Como Ejemplo un problema de muestreo.
Figura de una Prueba de dos Colas
Intervalos de Confianza para Número de Individuos y Proporciones
Experimentos con Muestras Pareadas.
Comparación de Clases
Tablas de Contingencia 2 2
© Manuel Pontigo Alvarad
Tablas de contingencia h x c
Mpontigo@itcr.ac.cr
Pruebas de Porcentajes. Marte 2004
ISBN 978- 9968 9634-3-5
Abrir Hoja Electrónica
Marte 200
3
Introducción
La Distribución de 2
2
2
2
El Intervalo de Confianza
La Aproximación a la Normal E.
Quizá la característica se deba a que sí se toma el lado positivo de la normal
estándar, la ecuación:
2 1
Se distribuye muy aproximadamente como una Normal Estándar
acumulativa cuando el número de Chi-cuadradas parciales es mayor a 30. Y
cuando los grados de libertad son = 2
z 2
P( 2 ) 2 P( z )
6
La Binomial.
En otras palabras, la prueba de 2 siempre hace referencia a
una prueba Normal Estándar de dos colas.
P (χ 2 ) P z α P z α
2 2
10 0 100 10!
P( x 0) p q 0,50 0,5100 1(0,00098) 0,00098
0 0!10 0!
Tamaño muestra 10
Prooprción interés p = 0,5 Distribución Binomial para n = 10 y p = 0,5
Proporción complementaria 0,5
Evento Número Probabilidad Propabilidad 0,30
x Combinaiones Binomial Evento
0,25
Probabilidades
0 1 0,00098 0,00098
1 10 0,00098 0,00977 0,20
2 45 0,00098 0,04395
0,15
3 120 0,00098 0,11719
4 210 0,00098 0,20508 0,10
5 252 0,00098 0,24609
0,05
6 210 0,00098 0,20508
7 120 0,00098 0,11719 0,00
8 45 0,00098 0,04395 0 1 2 3 4 5 6 7 8 9 10
9 10 0,00098 0,00977 Eventos posibles de x en 10
10 1 0,00098 0,00098
Sumas 1,00000
E v e n to F r e c u e n c ia s
pix i p ix i x 2 Para obtener el promedio
x o p r o b a b ilid a d
0 0 ,0 0 1 0 0 ,0 0 0 0 0 ,0 2 4 4 y la varianza se utilizó la
1 0 ,0 0 9 8 0 ,0 0 9 8 0 ,1 5 6 3 alternativa de multiplicar
2 0 ,0 4 3 9 0 ,0 8 7 9 0 ,3 9 5 5 la probabilidad de cada
3 0 ,1 1 7 2 0 ,3 5 1 6 0 ,4 6 8 8
4 0 ,2 0 5 1 0 ,8 2 0 3 0 ,2 0 5 1 evento por el número de
5 0 ,2 4 6 1 1 ,2 3 0 5 0 ,0 0 0 0 aciertos que indica. Como
6 0 ,2 0 5 1 1 ,2 3 0 5 0 ,2 0 5 1 se sabe, el promedio se
7 0 ,1 1 7 2 0 ,8 2 0 3 0 ,4 6 8 8
8 0 ,0 4 3 9 0 ,3 5 1 6 0 ,3 9 5 5
puede obtener mediante:
9 0 ,0 0 9 8 0 ,0 8 7 9 0 ,1 5 6 3
10 0 ,0 0 1 0 0 ,0 0 9 8 0 ,0 2 4 4
= np = 10 0,5 = 5 y la
varianza:
M u e s tra s 10
P r o m e d io 5 2 = npq = 10 0,25 = 2,5
V a r ia n z a 2 ,5 con una = 1,5811.
D e s v ia c ió n E s tá n d a r 1 ,5 8 1 1
11
Límites Estandarizados.
Para poder comparar la distribución Binomial con la Normal
Estándar es necesario suponer que los eventos ocurren de una
manera continua. Para esto debe considerarse que el límite
superior de una clase se une al inferior de la siguiente sin
solución de continuidad. Esto es, de la mitad entre un evento y
otro. -0,5, 0,5, 1,5, 2,5, 3,5 y así sucesivamente hasta el intervalo
10,5.
Después se obtiene las variables estandarizadas de ambos
límites, la probabilidad acumulada que determinan en la
distribución Normal Estándar de manera que la diferencia de
la probabilidad del límite superior menos la probabilidad del
límite inferior determinan la probabilidad del intervalo. Los
cálculos en la siguiente diapositiva.
12
Probabilidades Esperadas.
LÍMITES VALORES z Probabilidades Acumuladas Probabilidad
Inferior Superior Inferior Superior Inferior Superior Binomial N. Estándar
-0,5 0,5 -3,4785 -2,8460 0,0000 0,0022 0,0010 0,0022
0,5 1,5 -2,8460 -2,2136 0,0022 0,0134 0,0098 0,0112
1,5 2,5 -2,2136 -1,5811 0,0134 0,0569 0,0439 0,0435
2,5 3,5 -1,5811 -0,9487 0,0569 0,1714 0,1172 0,1145
3,5 4,5 -0,9487 -0,3162 0,1714 0,3759 0,2051 0,2045
4,5 5,5 -0,3162 0,3162 0,3759 0,6241 0,2461 0,2482
5,5 6,5 0,3162 0,9487 0,6241 0,8286 0,2051 0,2045
6,5 7,5 0,9487 1,5811 0,8286 0,9431 0,1172 0,1145
7,5 8,5 1,5811 2,2136 0,9431 0,9866 0,0439 0,0435
8,5 9,5 2,2136 2,8460 0,9866 0,9978 0,0098 0,0112
9,5 10,5 2,8460 3,4785 0,9978 1,0000 0,0010 0,0022
Sumas 1,0000 1,0000
Diferencias de Probabilidades.
En la figura de la derecha se Comparando Distribuciones
Variable z
Probabilidades
binomial está representada por 0,20
0,10
la N. Estándar con los 0,05
La Hipótesis.
Probabilidades
P(0,0081) < 0,025
0,20 de zona de
diagrama de la distribución 0,15
z(M)=-2,38. rechazo de Ho.
P(0,0085) < 0,025
binomial y normal para 10 0,10 de zona de
rechazo de Ho.
individuos. Las proporción con 0,05
χ 2 2 1
x1 np 0,5
2
x2 nq 0,5
2
np nq
157 0,63 221 0,5 2
61 0,37 221 2,1422 3,6475 5,7896
0,63 221 0,37 221
2 1
np nq
55 0,63 107 0,5 2
52 0,37 107 2,1043 3,5829 5,6872
0,63 107 0,37 107
221
16 - 25,5 0,5
2
35 25,5 0,5
2
6,3529
25,5 25,5
1 1
6, 3529
6,3529
6, 3529 2 1
F (6,3529; - 1) Y0 2 e 2
d 0,0117
0
2π
e
dz 0,0059
51 0,5 0,5
χ 2 4 1
315 312,8 0,5
2
108 104,3 0,5
2
101 104,3 0,5
2
312,8 104,3 104,3
32 - 34,8 0,5 2
0,3293
34,8
1 1
0 , 3293
,3293 4 1
0 , 3293
F (0,3293; 4 - 1) Y0 2 e 2
d 0,9544
0
La ecuación de la 2 ya es notoria:
2
h c
x
ij
npij 0,5
2
hc
fo
ij feij 0,5 2
( h 1)( c 1)
i 1 npij i 1 feij
42 - 58,7 0,5 752 - 768,7 0,5 2
2 1 2 1
378,3 58,7 768,7
136 - 119,3 0,5 2
7,7116
119,3
2
c
h fo
ij feij 0,5 2
; i 1,2,..., c; j 1,2,..., h
( h 1)( c 1)
i 1 j 1 feij
DISTR.CHI(19,2270; 3 5) 0,2036
Resultado de la prueba. 47
1
x np
z 2
npq
Es una variable con distribución Normal Estándar.
Dividiendo por n:
1 1 1
x np pˆ p
n 2 2n
z
1 1 pq
npq
n n n
5.50 La prueba estadística de DMS (Diferencia 50
Mínima Significativa).
Si se contrastan los valores estandarizados z de dos
proporciones se obtendría una nueva variable estandarizada:
pˆ 1 pˆ 2
z d z1 z 2
1 1
pq
n1 n2
Que puede escribirse como:
1 1
zd pq p1 p2
n1 n2
Si se elige z para un nivel de significación específico , el
estadístico se convierte en una prueba llamada Diferencia
Mínima Significativa:
1 1
zα pq DMS
n1 n2
La Regla de Decisión en el Contraste. 51
Proporciones Observaciones
Contraste 1 2 Diferencia n1 n2 DMS zd Probabilidad Resultado
18-20 vs 21-30 0,1227 0,1948 -0,0721 326 811 0,04530 -3,1204 0,0009 **
18-20 vs 31-40 0,1227 0,1527 -0,0300 326 943 0,04438 -1,3250 0,0926 ns
18-20 vs 41-50 0,1227 0,1249 -0,0022 326 905 0,04462 -0,0950 0,4622 ns
18-20 vs 51-60 0,1227 0,1259 -0,0032 326 834 0,04512 -0,1390 0,4447 ns
18-20 vs 61-70 0,1227 0,1384 -0,0157 326 708 0,04624 -0,6663 0,2526 ns
21-30 vs 31-40 0,1948 0,1527 0,0421 811 943 0,03308 2,4952 0,0063 **
21-30 vs 41-50 0,1948 0,1249 0,0700 811 905 0,03340 4,1051 0,0000 **
21-30 vs 51-60 0,1948 0,1259 0,0689 811 834 0,03407 3,9652 0,0000 **
21-30 vs 61-70 0,1948 0,1384 0,0564 811 708 0,03553 3,1114 0,0009 **
31-40 vs 41-50 0,1527 0,1249 0,0278 943 905 0,03215 1,6976 0,0448 ns
31-40 vs 51-60 0,1527 0,1259 0,0268 943 834 0,03284 1,6000 0,0548 ns
31-40 vs 61-70 0,1527 0,1384 0,0143 943 708 0,03435 0,8151 0,2075 ns
41-50 vs 51-60 0,1249 0,1259 -0,0010 905 834 0,03316 -0,0613 0,4756 ns
41-50 vs 61-70 0,1249 0,1384 -0,0136 905 708 0,03466 -0,7666 0,2217 ns
51-60 vs 61-70 0,1259 0,1384 -0,0125 834 708 0,03530 -0,6951 0,2435 ns
Los conductores entre 21 y 30 años sufren más accidentes que los
conductores de otras edades. Los resultados no son contradictorios a la
prueba anterior pues en este caso no se habla de número de accidentes que si
toma en cuenta la prueba en tabla de contingencia. Esto es, no hay
interacción entre edad y número de accidentes. En todas las clasificaciones
de accidentes la diferencia se manifiesta.
Resumen 54