Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribuciones discretas
-¿Qué tal van las clases,
Bartolo? Me pregunta mi
barbero.
-Bien... Dando probabilidad
y estadística... Respondo.
-¡Ah! Probabilidad... Yo
suelo jugar a la lotería...
Dice mientras me pasa la
cuchilla.
-Cuando compro un número, tal y como yo lo veo, hay dos
posibilidades: ganar o perder. De modo que tengo un 50% de
probabilidad de ganar y un 50% de perder.
-¡Muy bien, Ricardo! Respondo, mientras pienso que no es bueno
contradecir a nadie que tenga una navaja en mi cuello... 1
Distribución de Bernoulli
Experimento de Bernoulli: solo son
posibles dos resultados: éxito o fracaso.
Podemos definir una variable aleatoria
discreta X tal que:
éxito 1
fracaso 0
Si la probabilidad de éxito es p y la de
fracaso 1 - p, podemos construir una
función de probabilidad:
Jacob Bernoulli
1 x
P( x) p (1 p)
x
x 0,1
Un típico experimento de Bernoulli es el lanzamiento de
una moneda con probabilidad p para cara y (1-p) para cruz.
2
1 x
P( x) p (1 p)
x
x 0, 1
Función de distribución:
1 p, para x 0
F ( x)
1, para x 1 3
Ejercicio: Calcular la esperanza y la varianza
de la distribución de Bernoulli.
1
E[ X ] x P( X x)
x 0
0 P( X 0) 1 P( X 1) p
1
Var ( X ) E[ X ] ( E[ X ]) x P( X x) p
2 2 2 2
x 0
0 P( X 0) 1 P( X 1) p
2 2 2
p p p (1 p )
2
4
Distribución geométrica
Consideremos el siguiente experimento:
Partimos de un experimento de Bernoulli donde la
probabilidad de que ocurra un suceso es
p (éxito) y la probabilidad de que no ocurra
q = 1- p (fracaso). Repetimos nuestro experimento
hasta conseguir el primer éxito. Definimos la variable
aleatoria X, como el número de fracasos hasta que
se obtiene el primer éxito. Entonces:
G( p) P( X x) 1 p p,
x
x 0,1, 2, ...
5
p(x)
G( p) P( X x) 1 p p,
x
x 0,1, 2, ...
x
Función de distribución:
n
F (n) (1 p) x p 1 (1 p) n 1
1 x 0
E( X )
p
1 p The geometric distribution Y is a special
Var( X ) 2 case of the negative binomial distribution,
p with r = 1. 6
The probability distribution of the The probability distribution of the
number X of Bernoulli trials needed to number Y = X − 1 of failures before
get one success, supported on the set the first success, supported on the set
{ 1, 2, 3, ...} { 0, 1, 2, 3, ... }
10
Experimento aleatorio: n = 3 lanzamientos de una moneda.
Probabilidad de éxito en cada lanzamiento (cara) = p.
Probabilidad de fracaso en cada lanzamiento (cruz) = 1- p = q.
3 p 2 (1 p)
3 p(1 p) 2
11
Supongamos que el experimento consta de n
intentos y definamos la variable aleatoria:
n x n x n! n x
B(n, p) p( x) p (1 p) p (1 p)
x
x x!(n x)!
13
The binomial distribution is
frequently used to model
the number of successes in
a sample of size n drawn
with replacement from a
population of size N. If the
sampling is carried out
without replacement, the
draws are not independent
and so the resulting
distribution is a
hypergeometric distribution,
not a binomial one.
However, for N much larger
than n, the binomial
distribution is a good
approximation, and widely
used.
14
Características de la distribución
binomial
Media
= E(X) = n p P(X) n = 5 p = 0.1
.6
= 5 · 0.1 = 0.5 .4
.2
= 5 · 0.5 = 0.25 0 X
0 1 2 3 4 5
Desviación estándar
P(X) n = 5 p = 0.5
np(1 p) .6
.4
Comprar un quincux:
http://www.qualitytng.com/.
Applets: Sir Francis Galton
http://www.jcu.edu/math/isep/Quincunx/Qui
ncunx.html (1822-1911) La vida y la obra de
Galton, así como el contexto histórico en que se
Quincunx desarrollaron, está muy bien explicado en el libro
de Stigler: "The History of Statistics" (cap. 8).
¿Cuál es la probabilidad de que en una familia de 4 hijos exactamente 2
sean niñas?
n x
p( x ) p (1 p ) n x
x
p 0.5; n 4; x 2
4 2
p( 2) 0.5 (1-0.5) 4 - 2
2
Si una décima parte de personas tiene cierto grupo sanguíneo, ¿cuál es la
probabilidad de que entre 100 personas escogidas al azar, exactamente 8
de ellas pertenezcan a este grupo sanguíneo? ¿Y si la pregunta es 8
como máximo?
n x 8
n x
p( x ) p (1 p ) n x p( x 8) p (1 p ) n x
x x 0 x
p 0.1; n 100; x 8 8
100 x
0.1 0.9100 x
100 8 x 0 x
p(8) 0.1 (1-0.1)92
8 20
Calcula la probabilidad de obtener al menos dos seises al
lanzar un dado cuatro veces.
n k nk
P(k ) p q (k 0,1,....n)
k
p = 1/6, q = 5/6, n = 4
4 1 5 4 1 5 4 1
2 2 3 4
22
Chuck-a-luck: Elige un número entre 1 y 6. Lanzas 3 dados.
Si el número que has elegido sale en los 3 dados cobras
3 euros. Si sale en 2 cobras 2 euros. Si sale en un dado
cobras 1 euro. Y si no sale en ninguno, pagas 1 euro.
¿Es un juego justo?
3 1 3 1
3 0 2
5 5
3 2
3 6 6 2 6 6
3 1 3 5
1 2 3
5
1 (1) 0.08
1 6 6 0 6
28
NACIMIENTO DE LA TEORIA DE PROBABILIDADES
Hay dos jugadores jugando a un juego, donde el primer
jugador gana con probabilidad p cada partida. El total de
lo apostado es ganado por el jugador que gana por
primera vez N partidas.
N j 1
N k n N k
P p (1 p ) n
n 0 N k
De modo que el primer jugador debería llevarse un porcentaje P del
premio y el segundo (1-P).
29
Distribución multinomial
Podemos generalizar la distribución binomial cuando hay
más de dos acontecimientos posibles (A1, A2, A3 ...) con
probabilidades p1 , p2 , p3 ... constantes y tales que:
pi 1
i
n!
p( x1 , x2 , x3...) x1 x2 x3
p1 . p2 . p3 ....
x1! x2! x3!..
30
Un método de diagnóstico tiene 3 resultados posibles:
positivo (P), negativo (N) y dudoso (D). Se sabe que, en la
población, el 10% de los sujetos son positivos, el 70%
negativos y el resto dudosos. ¿Qué probabilidad hay de, en
una muestra de 5 individuos, obtener exactamente 1 positivo,
1 negativo y 3 dudosos ?
5!
p(1,3,1) 0.1 0.7 0.2 0.0112
1 1 3
1!.3!.1!
31
32
¿Cómo simular de manera sencilla en el ordenador
una variable aleatoria binomial X?
Entonces tenemos:
i 1
P(Y i) P(1 q rnd 1 q )
i
i 1 i 1 i 1
q q q (1 q) q p.
i
1 q rnd
Y
Ln (1 rnd )
Y int
Ln q
35
Un acontecimiento ocurre, en la población, en el 10% de los
casos. ¿Qué tamaño de muestra debo tomar para tener una
probabilidad del 95% de obtener al menos un éxito ?
n
q 1
n
0.95 pq x 1
p
x 1 q 1
0.9n 1
0.95 0.1 0.95 (0.9n 1) 0.95 0.9n 1
0.9 1
ln 0.05
0.05 0.9 ln 0.05 n ln 0.9 n
n
28.4 29
ln 0.9
36
Distribución binomial negativa
Consideremos el siguiente experimento:
Partimos de un experimento de Bernoulli donde la probabilidad
de que ocurra un suceso es p (éxito) y la probabilidad de que
no ocurra q = 1- p (fracaso). Repetimos nuestro experimento
hasta conseguir el r-ésimo éxito. Definimos la variable
aleatoria X, como el número de fracasos x hasta que se
obtiene el r-ésimo éxito. Entonces: El último tiene que ser un éxito.
x r 1 r
BN (r , p) P( X x) p 1 p ,
x
x
x 0,1, 2, ...
Se denomina binomial negativa porque los coeficiente provienen de
la serie binomial negativa: p -x (1-q) -x 37
Distribución binomial negativa
(de Pascal o de Pólya)
x 1 r
BN (r , p) P( X x) p 1 p x r ,
r 1
x r, r 1, r 2, ...
E( X ) r / p
r (1 p)
Var ( X )
p2 38
Disponemos de una moneda trucada con probabilidad de cara
igual a p=0.25. La lanzamos hasta que obtenemos 2 caras.
La distribución del número de lanzamientos x será:
x 1
BN (r 2, p 0.25) P( X x) 0.25 1 0.25 ,
2 x2
2 1
x 2,3, 4, ...
P(x)
39
x
Una aeronave tiene 3 computadoras idénticas. Sólo una de
ellas se emplea para controlar la nave, las otras 2 son de
reserva, redundantes, por si falla la primera. Durante una
hora de operación la probabilidad de fallo es 0.0005.
– ¿Cuál es el tiempo promedio de fallo de las tres
computadoras?
– ¿Cuál es la probabilidad de que las 3 fallen durante
un vuelo de 5 horas?
a)
E ( x) 3/ 0.0005 6000h
b)
P( x 5) P( X 3) P ( X 4) P ( X 5)
3 4
0.0005 0.0005 (0.9995) 0.00053 (0.9995) 1.249 x109
3 3
2 2
Elegir al azar con reemplazo
Elegir al azar con reemplazo significa que escogemos al azar
un elemento de un conjunto y lo regresamos para elegir de nuevo
al azar. Esto garantiza la independencia de las elecciones y nos
lleva a una distribución binomial.
A N A
x n x
H (n, N , A) P( x) ( x 0,1, ..., n)
N
n 46
Queremos seleccionar al azar dos bolas de una caja que contiene
10 bolas, tres de las cuales son rojas. Encuentra la función de
probabilidad de la variable aleatoria : X = Número de bolas rojas
en cada elección (con y sin reemplazo).
Tenemos N = 10, A = 3, N - A = 7, n = 2
Escogemos con reemplazo:
2 x
2 3
x
7
p( x) , p(0) 0.49, p(1) 0.42, p(2) 0.09
x 10 10
Escogemos sin reemplazo:
3 7
x 2 x 21 3
p( x) p(0) p(1) 0.47 , p(2) 0.07
10 45 45
2 47
Se debe seleccionar 2 miembros de un comité, entre 5, para
que asistan a una convención. Suponga que el comité está
formado por 3 mujeres y 2 hombres. Determine la
probabilidad de seleccionar 2 mujeres al azar:
Tenemos N = 5, n = 2, A = 3 y x = 2:
3 2
2 0
f (2)
3
0.3
5 10
2
Hipergeométrica Binomial
N = 24 n=5
X=8 p = 8/24 =1/3
n=5 Observa que si N,
x P(x) P(x) Error A, N-A son grandes
0 0.1028 0.1317 -0.0289 comparados con n
1 0.3426 0.3292 0.0133
2 0.3689 0.3292 0.0397
no hay gran
3 0.1581 0.1646 -0.0065 diferencia en qué
4 0.0264 0.0412 -0.0148
-0.0028
distribución
5 0.0013 0.0041
N = 240 n=5
empleemos.
X = 80 p = 80/240 =1/3 La distribución
n=5
binomial es una
x P(x) P(x) Error aproximación
0 0.1289 0.1317 -0.0028
1 0.3306 0.3292 0.0014
aceptable a la
2 0.3327 0.3292 0.0035 hipergeométrica
3 0.1642 0.1646 -0.0004 si n < 5% de N.
4 0.0398 0.0412 -0.0014 49
5 0.0038 0.0041 -0.0003
Distribución de Poisson
Cuando en una distribución binomial el número de intentos (n)
es grande y la probabilidad de éxito (p) es pequeña, la
distribución binomial converge a la distribución de Poisson:
e x
p ( x) , x 0,1,2,... 0 donde np =
x!
Observa que si p es pequeña, el éxito es un “suceso raro”.
La distribución de Poisson, junto con la uniforme y la binomial,
son las distribuciones más utilizadas.
P(X) = 6
.6
.4
Nota: el máximo de la distribución .2
se encuentra en x 0 X
0 2 4 6 8 10
55
La distribución de Poisson se obtiene como aproximación de
una distribución binomial con la misma media, para ‘n grande’
(n > 30) y ‘p pequeño’ (p < 0,1). Queda caracterizada por un
único parámetro μ (que es a su vez su media y varianza).
np =
La distribución de Poisson es asimétrica,
siendo en general más probables los
valores pequeños de la variable que los
mayores (normalmente se asocia a
procesos que ocurren muy pocas veces).
Sin embargo, si crece, la distribución
tiende a la simetría.
Predicho
60
10 x 10
Muertos por coz de caballo
La explicación de cómo se interpreta la frecuencia acumulada queda mucho más clara si se
tienen los datos desglosados por año y regimiento, tal como aparecen en la publicación original
de Bortkiewicz. La tabla de la parte superior contiene los muertos por regimiento y año. En el
regimiento G (primera fila) no murió nadie en el año 75, murieron 2 en el 76, otros 2 en el 77… En
total hay 144 casillas que tienen un cero (una rayita), 91 casillas que tienen un 1, 32 casillas que
tienen un 2…
Para tener el valor medio de muertos por casilla hay que ver que el total de muertos es:
1×91+2×32+3×11+4×2=196. Como hay 280 casillas, el número medio de muertos por casilla es
196/280=0,7. Con este valor medio y aplicando la fórmula de la distribución de Poisson se tiene
que:
-Probabilidad de 0 muertos = 0,4966
-Probabilidad de 1 muerto = 0,3476 ; etc.
Una vez se tienen las probabilidades, multiplicando por 280 se tienen los valores esperados.
Cuando escribí el libro busqué los datos originales pero no los encontré. Reproduje la tabla tal
como la vi en el texto de Bulmer, ahora veo que es muy parecida a la que aparece en el original
(parte central de la página). Hay algo que no entiendo (mi alemán = 0): lo que parece la columna
de valores esperados no coincide con los resultados que se obtienen. No sé si se está calculando
otra cosa o hay algún error de cálculo o de redondeo. El texto completo se puede descargar aquí.
62
Relación entre las distribuciones Poisson y Binomial
La distribución de Poisson es una aproximación de la
distribución Binomial cuando n es muy grande y p es pequeño
En estos casos, podremos usar tanto la distribución de Poisson
como la binomial para calcular estas probabilidades. ¿Cómo?
Veamos un ejemplo:
La probabilidad de que en una página de un libro haya una errata
es 0.02. ¿Cuál es la probabilidad que en libro de 200 páginas
haya 3 erratas?
200
P ( X 3) 0.023 0.98197 0.1973
3
También podríamos calcularlo usando la distribución de Poisson.
Fíjate que E(X) = np = 200*0.02 = 4. En la distribución de
Poisson, el parámetro representa la esperanza de la variable,
por tanto, para calcular la aproximación, consideramos X sigue
una distribución P(4), entonces:
P( X 3) 43 e 4 / 3! 0.1954
np < 10
Un proceso poissoniano es aquél compuesto de
eventos discretos que son independientes en el
espacio y/o en el tiempo.
Por ejemplo la llegada de fotones a un detector.
P( X 0) B(n, p,0) (1 p) 1
n
n
Observa que para n grande P(X = 0) es aproximadamente e-λ.
Además para n grande (y por tanto p muy pequeño):
B(n, p, k ) (k 1) p
B(n, p, k 1) k (1 p) k 67
Tenemos entonces B(n, p,0) e
la siguiente ecuación
iterada: B(n, p, k ) B(n, p, k 1)
k
P( X 1) B(n, p,1) e
2
P( X 2) B(n, p,2) e
2
...
k
P( X k ) e
k! 68
La señal promedio recibida en un telescopio de una fuente
celeste es de 10 fotones por segundo. Calcular la probabilidad
de recibir 7 fotones en un segundo dado.
Existe una gran dispersión, y no sería extraño encontrar que en realidad hay
muchas más personas o menos que están enfermas. La probabilidad de que
haya más de tres personas enfermas es:
Benford's Law
The leading digit of a number
represents its non-zero leftmost digit.
299.959 0,0174
x , x m 10 , 1 m 10
n
d ( x) m
Rivers, Area 31.0 16.4 10.7 11.3 7.2 8.6 5.5 4.2 5.1 335
Population 33.9 20.4 14.2 8.1 7.2 6.2 4.1 3.7 2.2 3259
Constants 41.3 14.4 4.8 8.6 10.6 5.8 1.0 2.9 10.6 104
Newspapers 30.0 18.0 12.0 10.0 8.0 6.0 6.0 5.0 5.0 100
Specific Heat 24.0 18.4 16.2 14.6 10.6 4.1 3.2 4.8 4.1 1389
Pressure 29.6 18.3 12.8 9.8 8.3 6.4 5.7 4.4 4.7 703
H.P. Lost 30.0 18.4 11.9 10.8 8.1 7.0 5.1 5.1 3.6 690
Mol. Wgt. 26.7 25.2 15.4 10.8 6.7 5.1 4.1 2.8 3.2 1800
Drainage 27.1 23.9 13.8 12.6 8.2 5.0 5.0 2.5 1.9 159
Atomic Wgt. 47.2 18.7 5.5 4.4 6.6 4.4 3.3 4.4 5.5 91
, 25.7 20.3 9.7 6.8 6.6 6.8 7.2 8.0 8.9 5000
Design 26.8 14.8 14.3 7.5 8.3 8.4 7.0 7.3 5.6 560
Reader's Digest 33.4 18.5 12.4 7.5 7.1 6.5 5.5 4.9 4.2 308
Cost Data 32.4 18.8 10.1 10.1 9.8 5.5 4.7 5.5 3.1 741
X-Ray Volts 27.9 17.5 14.4 9.0 8.1 7.4 5.1 5.8 4.8 707
Am. League 32.7 17.6 12.6 9.8 7.4 6.4 4.9 5.6 3.0 1458
Blackbody 31.0 17.3 14.1 8.7 6.6 7.0 5.2 4.7 5.4 1165
The law of Addresses 28.9 19.2 12.6 8.8 8.5 6.4 5.6 5.0 5.0 342
anomalous numbers. , 25.3 16.0 12.0 10.0 8.5 8.8 6.8 7.1 5.5 900
Proc. Am. Philos. Soc. Death Rate 27.0 18.6 15.7 9.4 6.7 6.5 7.2 4.8 4.1 418
78 (1938) 551-538. Average 30.6 18.5 12.4 9.4 8.0 6.4 5.1 4.9 4.7 1011
Probable Error
5.761.455 primes 50.847.534 primes
Scale
invariance
10k ( d 1) 10 (d 1)
k
d 1
x dx log log
1
d
10k d k
10 d
Generalized Benford's Law (GBL)
P( x) ~ x
1
(d 1)
k
10k ( d 1) (10 )
1 1
x dN d
10 dk
1
P(d )
10
1
1
1
(d 1) 1
d 1
1; d 1, 2, ... ,9
lim P(d ) 1 / 9
0
5.761.455 primes 50.847.534 primes
(25) = 9.
"For me, the smoothness with which this curve climbs
is one of the most astonishing facts in mathematics."
x du
Li ( x)
2 Ln u
"within the accuracy of our picture, the two coincide exactly."
Don Zagier, "The first 50 million primes"
Mathematical Intelligencer, 0 (1977) 1-19
Prime Number Theorem
Valee Poussin and Hadamard (1896)
x
( x) ~
ln x
( x)
lim 1
x x / ln x
God may not
play dice with
the universe,
but something
strange is
going on with
the prime
numbers.
Paul Erdös
Modelo de Cràmer
Conditions for conformance to GBL
Conditions for conformance to GBL
Conditions for conformance to GBL
The primes counting function L(N)
N
L( N ) e ( N ) x ( N )
dx
cte
e ( N ) 1 ( N )
L( N ) N
1 (N )
1
with ( N )
Ln N a
Minimum for a = 1
105