Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DISTRIBUCIONES DE PROBABILIDAD.
Definción 1: La función cuyo valor es un número real determinado por cada elemento en el
espacio muestral, se llama variable aleatoria.
Definición 2: Una variable aleatoria X es una función de valor real de los elementos de un
espacio muestral S. Aquí se nota que el dominio es S y su rango R.
Ejemplo 1.- Se tira una vez un par de dados. Sea X la suma de los dos números que
aparecen. El espacio muestral es:
X = X1 + X 2 para ( X1 , X 2 ) S
El rango de X es RX = 2,3,12 de manera que X es una variable aleatoria discreta.
Ejemplo 2.- Supóngase que una persona sale de su casa a su trabajo entre las 8:00 y las
8:30, sea t el tiempo desde las 8:00 hasta que sale; de acuerdo con lo anterior se tiene
S = t / 0 t 30 con este espacio muestral se puede escribir la variable aleatoria
Z en notación funcional como: Z (t ) = 30 − t para todo t S entonces:
Definición: Sea X una variable aleatoria discreta. Por tanto rx, el recorrido de X consta a lo
más de un número de valores x1 , x2 , infinito numerable. Con cada resultado posible
xi asociamos un número P(xi ) o f (xi ) = P( X = xi ) llamado la probabilidad de xi . Los
números P(xi ) donde i = 1,2, deben satisfacer las condiciones siguientes:
a) P( xi ) 0 para toda i
b) P( x ) = 1
i =1
i
xi 2 3 4 5 6 7 8 9 10 11 12
P ( xi )
1 2 3 4 5 6 5 4 3 2 1
36 36 36 36 36 36 36 36 36 36 36
xi 0 1 2
P ( xi )
1 1 1
4 2 4
Si X es una variable aleatoria, entonces, para cualquier número real x existe la probabilidad
P( X x ) del evento:
Así F ( x) = P( X x )
Es importante distinguir entre P(x) y F (x) mientras que P(x) denota la probabilidad del
evento X = x ; F(x ) denota la probabilidad del evento X x .
En general P ( X x ) = P(x ) i o F ( x) = P( x )i
X1 x Xi x
p(x)
2 3 4 5 6 7 8 9 10 11 12 x
1 3 6 10 15 21 26 30 33 35 36
F(x)
36 36 36 36 36 36 36 36 36 36 36
F(x)
0 1 2 3 4 5 6 7 8 9 10 11 12 x13
Distribuciones Continuas.
Se dice que una variable aleatoria X y la distribución correspondiente son de tipo continuo
o, más brevemente, continuas, si la función de distribución correspondiente:
F ( X ) = P( X x)
se puede presentar según una integral de la forma:
x
F ( x) = f (v)dv
−
(4.1)
F ' (x ) = f (x )
para cualquier x tal que f (x) es continua. De esta manera, la densidad es la derivada de la
función de distribución.
f (v)dv = 1
−
Esto significa que la probabilidad del evento a X b es igual al área que hay bajo la
curva de la densidad f (x) entre x = a y x = b , como se ve en la figura 4.3.
f(x)
a b
P (a X b) = P (a X b) = P (a X b)
Valor medio: El valor medio o media de una distribución se representa por . En el caso
de una distribución discreta se define como:
= x j f (x j ) (4.2)
j
f (x ) =
1
si x = 1, 2, , 6
6
f (x )
1
cuando 0 X b y 0 para todas las demás x.
b−a
Distribuciones discretas
Distribución binominal
En algunos casos, una población consta de dos clases de elementos, por ejemplo, seres
animados o inanimados, objetos pares o impares anversos o reversos de monedas, o
simplemente poseedores o no poseedores de cierta característica (ejemplo un defecto).
Los experimentos de este tipo se conocen como experimentos binomiales si se cumplen las
siguientes características:
1. Hay solamente dos resultados posibles en cada caso; éxito (e) y fracaso (f).
Para encontrar la expresión que nos proporcione la probabilidad de que ocurran x éxitos en
n ensayos de un experimento binomial, razonamos como sigue:
La variable X puede tomar los valores 0, 1, 2,n y se desea determinar las probabilidades
correspondientes; con este propósito consideramos el evento X = x , que significa que en x
de los n ensayos ocurre “éxito” y en los n − x ocurre “fracaso”. Esto se puede ver como
sigue:
Es obvio que (a) es un arreglo en un solo orden de las x resultados “e” y las n − x
resultados “f”; entonces la probabilidad de x es igual a P x q n− x veces el número de arreglos
diferentes de los x resultados “e” y las n − x resultados “f” esto es:
n
b( x; n, p ) = p x q n − x x = 0,1,2n (4.6)
x
x x
n
B( x; n, p ) = b(k , n, p ) = p k q n − k (4.7)
k =0 k =0 k
Solución: b(3; 10, 0.10) = B(3; 10, 0.10) − B(2; 10, 0.10) = 0.9872 − 0.9298
b(3; 10, 0.10) = 0.0574
d) Mueran de 2 a 5 personas.
5
Solución: b(k , n, p ) = B(5; 10, 0.10 ) − B(1; 10, 0.10 )
k =2
= 0.9999 − 0.7361 = 0.2638
Cuando p > 0.5 y debido a que algunas tablas no tienen valores mayores que ( p = 0.5)
se usa lo siguiente:
Teorema:
b(x; n, p ) = B(n − x; n, 1 − p ) − B(n − x − 1; n, 1 − p )
B(x; n, p ) = 1 − B(n − x − 1; n, 1 − p )
Media y varianza de la distribución binominal
n
x = E ( x ) = x f ( x ) = ( x ) ( p x q n − x ) = x
n n n
n!
p x q n− x
x =0 x =0 x x =0 x ! (n − x )!
= np
n
(n − 1)! p x −1 (1 − p )
n− x
= np( p + q )
n −1
= np
x =1 ( x − 1) ! (n − x ) !
x = np
n n
x2 = E (x − )2 = (x − )2 f (x ) = x 2 f (x ) − 2 ( ) + 2
x =0 x =0
n n
= x 2 f (x ) − (np) =
x =0
2
x(x − 1) + x
x =0
f ( x ) − (np )
2
n n
= x( x − 1) p x (1 − p ) + x f ( x ) − (np)
n! n− x 2
x =2 x ! (n − x )! x =0
= n (n − 1) p 2
n
(n − 2)! (1 − p )n − x + np − (np)
(x − 2)! (n − x )! p
x=2
x−2 2
= n (n − 1) p 2 ( p + q )n−2 + np − (np)
2
x2 = n p q
Distribución de Poisson
e− x
f (x, ) = x = 0, 1, 2 (4.8)
x!
Demostración:
n
b( x; n, p ) = p x q n − x para x fija, hacemos que n → y p → 0 a través de
x
sucesiones de valores en donde np = , entonces el límite de:
e− x
b(x; n, p ) es f ( x; )
x!
Partimos de = np p = /n y px = x / nx
n− x −x
n
= (1 − p )
n− x n− x
de igual manera q = 1 − = 1 − 1 −
n n n
x n (n − 1) (n − x + 1)
−x
n
b( x; n, p ) = 1 − 1 −
x! nx n n
cuando n → la expresión:
n (n − 1) n − x + 1 n n − 1 n − x + 1
= →1
nx n n n
−x
n
−
1 − → e ; 1 − →1
n n
En esta distribución = 2 .
Función de distribución
x
F ( x, ) = f (k , ) ; esta función se encuentra tabulada para diferentes valores de .
k =0
Tabla II.
a) Exactamente 2 imperfecciones.
= 0.2(5) = 1min
Solución:
f (2; 1) = F (2; 1) − F (1; 1) = 0.920 − 0.736 = 0.184
b) A lo más 2 imperfecciones.
Solución:
F (2; 1) = 0.920
Solución:
1 − F (2; 1) = 1 − 0.920 = 0.080
d) De 2 a 4 imperfecciones.
Solución:
4
Distribuciones continuas
Distribución normal
1 x−
2
−
f (x ) =
1
e 2
0
2
Se le llama distribución normal ó Gaussiana. Se dice que una variable aleatoria que tiene
esta distribución es normal o está distribuida normalmente.
La curva que representa f (x) se denomina curva acampanada y es simétrica con respecto a
X = . Véase la figura 4.4.
μ=0 x
1 v−
2
−
F (x ) =
1
X
2
e dv (4.10)
2 −
Dado que cuando X es una variable aleatoria continúa. p ( X = c ) = 0 , solo tiene sentido el
cálculo de probabilidades de que la variable se encuentre dentro de un cierto intervalo, así:
1 v−
2
−
P(a X b ) = F (b ) − F (a ) =
1
b
2
e dv (4.10.a)
2 a
como la integral que aparece en la ecuación (4.10) no se puede evaluar por métodos
elementales, se transforma en la integral:
−
1
( r )2
(Z ) =
1 Z
2 −
e 2
dr (4.10.b)
cuyos valores se encuentran tabulados para diferentes valores de Z (tabla III). Esta función
de distribución corresponde al caso en que = 0 y = 1 . Esta situación difícilmente
ocurre en la práctica. Sin embargo, como este es un caso muy particular, la expresión 4.10
se puede transformar en 4.11 mediante un cambio de variable sencillo:
v−
r= dv = dr
− ( r )2
1
F (x ) =
1
x
2
e dr donde la expresión de la derecha es igual que en
2 −
v−
4.10.a con r = por lo tanto tenemos la relación básica.
x−
P( X x ) = F ( x ) =
a−
P( X a ) = F (a ) =
a−
P ( X a ) = 1 − P ( X a ) = 1 − F (a ) = 1 −
b− a−
P (a X b ) = F (b ) − F (a ) = −
+ − − −
a) P( − X + ) = − = (1) − (− 1) = 0.6827
+ 2 − − 2 −
b) P ( − 2 X + 2 ) = − = (2) − (− 2) = 0.9545
+ 3 − − 3 −
c) P ( − 3 X + 3 ) = − = (3) − (− 3) = 0.9973
Ejemplo: Supóngase que el tiempo que dura cierta marca de baterías para automóvil se
distribuye normalmente con una media = 600 días y una desviación estándar de 30 días;
calcular el porcentaje de baterías que duran:
660 − 600
Solución: P ( X 660 ) = F (660 ) = = (2) = 0.9772
30
550 − 600
Solución: 1 − P ( X 550 ) = 1 − F (550 ) = 1 − = 1 − (− 1.67 )
30
= 1 − 0.0475 = 0.9525
Solución:
660 − 600 540 − 600
P (540 X 660 ) = F (660 ) − F (540 ) = −
30 30
= (2) − (− 2) = 0.9545
d) ¿Cuál deberá ser la garantía si el fabricante solo está dispuesto a reparar o cambiar
el 10% de las baterías?
Solución: P( X G) = 0.10
F (G ) = 0.10
G − 600
= 0.10
30
G − 600
= −1.282
30
G = Garantía = 600 − 30(1.282 ) = 561.54días
Aproximación de la distribución binomial mediante la distribución normal.
n x n− x
b( x; n, p ) =
x p q
Con media = np
y varianza 2 = n p q
Teorema
z2
n x n− x 1 − x − np
p q e 2
; z=
x npq 2 npq
Además.
b
n
P(a x b ) = p x q n − x = ( ) − ( )
x=a x
a − np − 0.05 b − np + 0.05
= =
npq npq
a) Calcule y 2 .
b) Construya su función de distribución acumulativa F ( X ) .
4.2. Una persona lanza dos monedas y recibirá N$4.00 si aparecen dos “caras” perderá
N$2.00 si aparecen dos “cruces” y perderá N$1.00 si en una moneda aparece “ cara “y
en la otra “cruz ”. ¿Cuál es la ganancia o pérdida por persona?
4.3. Supóngase que el 20% de cierta población tiene el grupo sanguíneo B. Para una
muestra de tamaño 20 extraída de esa población, calcule la probabilidad de encontrar:
4.4. El 10% del total de un gran lote de producción son defectuosos. Si se toma una muestra
aleatoria de 15 artículos, calcular la probabilidad de encontrar:
a) Menos de 4 defectuosos.
b) Por lo menos 2 defectuosos.
c) A lo más 5 defectuosos.
d) Entre 2 y 5 defectuosos.
e) Más de 6 no defectuosos.
4.6. Supóngase que en la inspección de una lámina metálica producida en rollos continuos
el número de imperfecciones localizadas por un inspector durante un periodo de 10
minutos sea una variable aleatoria con distribución de Poisson de = 1.4 . Hallar las
probabilidades de que durante un periodo de 10 minutos un inspector encuentre:
a) Ninguna imperfección.
b) Dos imperfecciones.
c) Más de dos imperfecciones.
d) Menos de 4 imperfecciones.
4.7. Si la probabilidad de que una persona sufra una reacción nociva debido a una inyección
de cierto suero es 0.001. Cuál es la probabilidad de que entre 1,000 personas
inyectadas:
4.8. Las capacidades de la cavidad craneana de cierta población, están distribuidas en forma
normal, con una media de 1,400 CC. Y una varianza de 14 400, encontrar la
probabilidad de que una persona elegida al azar de esta población tenga una capacidad
de la cavidad craneana:
4.9. Para los gatos, la dosis letal media de cierta tintura es 13.4 CC y = 0.945 . ¿Qué
porcentaje de los gatos se estimará que mueran con una dosis menor que 12.00 CC?
4.10. El tiempo de vida de cierto tipo de baterías para automóvil es una variable aleatoria
normal con media de 1760 días y desviación estándar de 60 días.
a. ¿Qué porcentaje de las baterías durará menos de 1740 días?
b. ¿Qué porcentaje durará entre 1750 y 1875 días?
c. ¿Cuál deberá ser la garantía para que el 95% de las baterías la resista?
MUESTREO
Definición: Una muestra probabilística es una muestra extraída de tal manera que todo
miembro de la población tenga una probabilidad conocida de ser incluido en la muestra.
El muestreo puede ser con reemplazo o sin reemplazo. El muestreo es con reemplazo si
todo miembro de la población después de medir la característica que interesa se regresa a la
población y es sin reemplazo si los miembros escogidos no son regresados a la población.
En general lo que se debe tener presente al seleccionar una muestra aleatoria es eliminar al
máximo cualquier tipo de discriminación.
Distribuciones muestrales.
Distribución Muestral: La distribución de todos los valores posibles que pueden ser
tomados por alguna estadística, calculados a partir de muestras del mismo tamaño extraídas
aleatoriamente de la misma población se llama distribución muestral de esa estadística.
(x − ) = 8 .
1
2 = i
n i =1
a) Sin reemplazo:
Muestra X
(1,3) 2
( 1 ,5 ) 3 X f f relativa
(1,7) 4 2 1 1/10
(1,9) 5 3 1 1/10
(3,5) 4 4 2 2/10
(3,7) 5 5 2 2/10
(3,9) 6 6 2 2/10
(5,7) 6 7 1 1/10
(5,9) 7 8 1 1/10
(7,9) 8
Representación gráfica.
_
f x
2
10
1
10
_
0 2 3 4 5 6 7 8 x
Figura 5.1. Distribución de la media de la muestra sin reemplazo.
_
Función de probabilidad de x .
_
2 3 4 5 6 7 8
x
_ 1 1 2 2 2 1 1
f x
10 10 10 10 10 10 10
_
Cálculo de la media y la varianza de x .
_ _
= E x = x i f x i = 2
n _
1 1 2 1
_ + 3 + 4 + + 8 =5
x i =1 10 10 10 10
2
_
n
_ 1 1 1
_ = x i − f x i = (2 − 5)2 + (3 − 5)2 + + (8 − 5)2 = 3
2
x i =1 10 10 10
2o. _2 2
x
b) Con reemplazo.
En este caso el número de muestras posibles de tamaño n = 2 será mayor ya que después de
tomar un elemento de la población éste es regresado una vez que se registra su valor; por lo
tanto en la siguiente extracción puede volver a aparecer. Esto no sucede en el muestreo sin
reemplazo. Esta población por lo tanto siempre permanece del mismo tamaño y su
comportamiento es similar al de una población infinita para fines de muestreo.
Una manera sencilla de escribir todas las muestras posibles es utilizar el siguiente
procedimiento
Primera extracción
1 3 5 7 9
1 (11) (13) (15) (17) (19)
1 2 3 4 5
2 3 4 5 6
4 5 6 7 8
5 6 7 8 9
x f f relativa
1 1 1/25
2 2 2/25
3 3 3/25
4 4 4/25
5 5 5/25
6 4 4/25
7 3 3/25
8 2 2/25
9 1 1/25
Representación gráfica.
_
_
f x
f x
1 2 3 4 5 6 7 8 9 x _
x
_
1 2 3 4 5 6 7 8 9
x
_ 1 2 3 4 5 4 3 2 1
f x
25 25 25 25 25 25 25 25 25
_
Cálculo de la media y varianza de x .
_ _
= E x = x f x = 1
_
1 2 1
_ +2 ++ 9 =5
x 25 25 25
2
_ _ 2 1 2 2 2 1
2
_ = x − f x = (1 − 5) + (2 − 5) + + (9 − 5) =4
x 25 25 25
2 2
_
x
_
1. La distribución de x será normal.
_
2. La media _ de la distribución de x será igual a la media de la población de la cual
x
se extrajeron las muestras.
_
3. La varianza, _2 de la distribución de x será:
x
2 N p − n
n N − 1 Si la población es finita (N p = tamaño poblacional)
_ =
2 p
x
2
n Si la población es infinita.
Para el caso en el que el muestreo se realiza a partir de una población no normal se aplica el
teorema del límite central.
Teorema: Dado una población de cualquier forma funcional, con una media y una
_
varianza finita 2 , la distribución muestral de x , calculada a partir de muestras de tamaño
n de esta población, estará distribuida aproximadamente en forma normal con media y
2
varianza cuando el tamaño de la muestra es grande.
n
Ejemplo:
Si las concentraciones de ácido úrico en los adultos del sexo masculino normales están
distribuidas aproximadamente en forma normal con una media de 5.7 miligramos por
ciento y una desviación estándar de 1; encontrar la probabilidad de que una muestra de
tamaño 9 tenga una media:
Solución:
= 5.7 y = = 5.7
_
x
1 1
=
_ = =
x n 9 3
_ 5.2 − 5.7
a) P x 5.2 = F (5.2 ) = = (− 1.5) = 0.0668
1
3
6 − 5.7
b) P x 6 = 1 − P x 6 = 1 − F (6) = 1 − = 1 − (0.9) = 1 − 0.8159 = 0.1841
_ _
1
3
_
6 − 5.7 5 − 5.7
c) P 5 x 6 = F (6) − F (5) = − = (0.9) − (− 2.1)
1 1
3 3
Teorema.
_ _ = 1 − 2 y
x1 − x 2
12 22
2 _ _ = +
x1 − x 2 n1 n2
Ejemplo:
Dadas dos poblaciones normalmente distribuidas con medias iguales y varianzas 12 = 100
y 22 = 80 . ¿Cuál es la probabilidad de que muestras de tamaño n1 = 25 y n2 = 16
_ _
proporcionen un valor de x1 − x 2 mayor o igual a 8?
Datos:
_ _ = 1 − 2 = 0 por que 1 = 2
x1 − x 2
12 22 100 80
2 _ _
= + = + =9
x1 − x 2 n1 n2 25 16
2 _ _ =3
x1 − x 2
_ _
_ _
P x1 − x 2 8 = 1 − P x1 − x 2 8
8−0
= 1 − F (8) = 1 − = 1 − (2.67 )
3
= 1 − 0.9962 = 0.0038
PROBLEMAS
5.2. Si los pesos de todas las personas que viajan por avión en vuelos regulares que parten
de un aeropuerto tienen una media de 65 kg. y una desviación estándar de 8 kg. ¿Cuál
es la probabilidad de que una muestra aleatoria de 36 personas tomadas de un vuelo,
tenga un peso medio:
5.3. Las estadísticas pecuarias que abarcan un extenso período de tiempo, muestran que en
una cierta región los pesos de todas las reses traídas al mercado se pueden aproximar
muy bien por una curva normal de media 1900 lb., y desviación estándar de 400 lb.
Cuál es la probabilidad de que el peso de una muestra aleatoria de 400 reses sea:
5.4. Un investigador se siente inclinado a creer que los niveles de vitamina A en los
hígados de dos poblaciones humanas están, en cada una, distribuidos normalmente. Se
supone que las varianzas para las dos poblaciones son como sigue:
Población 1: 12 = 19600
Población 2: 22 = 8100
5.5. Dadas dos poblaciones no distribuidas normalmente, con medias iguales y varianzas
12 = 240 y 22 = 350 . ¿Cuál es la probabilidad de que muestras de tamaño n1 = 40 y
_ _
n2 = 35 proporcionen un valor de x1 − x 2 menor o igual a 12?