Documentos de Académico
Documentos de Profesional
Documentos de Cultura
concepto que se utiliza para describir cualquier proceso mediante el cual se generan
varias observaciones al azar
Variable aleatoria
Una variable aleatoria es una función que asocia un número real con cada elemento
del espacio muestral.
Se utiliza una letra mayúscula por ejemplo X , para denotar una variable aleatoria y su
correspondiente letra minúscula x en este caso, para uno de sus valores.
Variable aleatoria discreta
La variable aleatoria tiene un conjunto de resultados posibles que se puede contar.
Variable aleatoria continua
La variable aleatoria puede tomar valores en una escala continua.
Espacio muestral discreto
Si un espacio muestral contiene un número finito de posibilidades, o una serie
interminable con tantos elementos como números enteros existen.
Espacio muestral continuo
Si un espacio muestral contiene un número infinito de posibilidades, igual al número
de puntos en un segmento de recta.
Distribución discreta de probabilidad
El conjunto de pares ordenados (x , f ( x )) es una función de probabilidad de la variable
aleatoria discreta X si, para cada resultado x posible se cumple:
1. f ( x ) ≥0
2. ∑ f (x )=1
3. P ( X=x )=f ( x )
2. ∫ f ( x)dx=1
−∞
1. μ= E ( x )=∑ xf ( x) ; si X es discreta.
∞
2. μ= E ( x )= ∫ xf ( x ) dx ; si X es continua.
−∞
−∞
σ 2=E ( X 2 ) −μ 2
Demostración:
σ =∑ ( x−μ ) f ( x )
2 2
σ 2=∑ x 2 f ( x )−2 μ ∑ xf ( x )+ μ 2 ∑ f ( x )
x x x
Como:
μ=∑ xf ( x )
x
1=∑ f ( x )
x
σ =∑ x f ( x )−2 μ + μ
2 2 2 2
σ =E ( X ) −μ
2 2 2
∞
σ =∫ ( x −μ ) f (x) dx
2 2
−∞
∞
σ =∫ ( x −2 xμ+ μ ) f (x)dx
2 2 2
−∞
∞ ∞ ∞
σ =∫ x f (x )dx−2 μ ∫ xf (x) dx + μ ∫ f ( x)dx
2 2 2
−∞ −∞ −∞
Como:
∞
μ= ∫ xf (x )dx
−∞
∞
1= ∫ f (x) dx
−∞
∞
σ =∫ x f (x ) dx−2 μ + μ
2 2 2 2
−∞
σ =E ( X ) −μ
2 2 2
0() () 1 2 ()
( q+ p ) = n q n + n p qn−1 + n p2 q n−2 +…+ n pn
n ()
( q+ p )n=b ( 0 ; n , p ) +b ( 1 ; n , p ) +b ( 2 ; n , p ) +…+b ( n ; n , p )
Dado que p+q=1, vemos que
n
∑ b ( x ;n , p )=1
x=0
σ 2=npq
Distribución Hipergeométrica
El número X de éxitos de un experimento hipergeométrico se denomina variable
aleatoria hipergeométrica. En consecuencia, la distribución de probabilidad de la
variable hipergeométrica se conoce como distribución hipergeométrica, y sus valores
se denotan con h ( x ; N , n , k ) , ya que dependen del número de éxitos k en el conjunto
N del que seleccionamos n artículos sin reemplazo.
h ( x ; N , n , k )=
( x )( n−x )
k N −k
;max {0 ,n−( N−k ) } ≤ x ≤min {n , k }
(n)
N
σ 2= (
nk N −n
N N −1
1−
k
N )( )
RELACIÓN CON LA DISTRIBUCIÓN BINOMIAL
Como se esperaría, si n es pequeña comparada con N, la naturaleza de los N artículos
cambia muy poco en cada prueba. Así, cuando n es pequeña en comparación con N, se
puede utilizar una distribución binomial para aproximar la distribución
hipergeométrica. De hecho, por regla general la aproximación es buena cuando n/N ≤
0.05. Por lo tanto, la cantidad k/N desempeña el papel del parámetro binomial p y,
como consecuencia, la distribución binomial se podría considerar una versión de
población grande de la distribución hipergeométrica.
Media:
nk
μ=np=
N
Varianza
σ 2=npq=
nk
N
1−(k
N )
Distribución de Poisson
La distribución de probabilidad de la variable aleatoria de Poisson X , la cual representa
el número de resultados que ocurren en un intervalo de tiempo dado o región
específicos t , es:
e−λt ( λt ) x
p ( x ; λt )= ; x=0,1,2 , …
x!
donde λ es el número promedio de resultados por unidad de tiempo, distancia, área o
volumen y e=2.71828 …
El proceso de Poisson tiene las siguientes propiedades:
1. El número de resultados que ocurren en un intervalo o región específica es
independiente del número que ocurre en cualquier otro intervalo de tiempo o región
del espacio disjunto. De esta forma vemos que el proceso de Poisson no tiene
memoria.
2. La probabilidad de que ocurra un solo resultado durante un intervalo de tiempo muy
corto o en una región pequeña es proporcional a la longitud del intervalo o al tamaño
de la región, y no depende del número de resultados que ocurren fuera de este
intervalo de tiempo o región.
3. La probabilidad de que ocurra más de un resultado en tal intervalo de tiempo corto
o que caiga en tal región pequeña es insignificante.
Media:
μ= λt
Varianza:
2
σ =λt
Distribución gamma
La función gamma se define como:
∞
Γ ( α )=∫ x
α−1 − x
e dx ;α > 0
0
{
1 α −1 −x/ β
x e ; x >0
f ( x ; α , β )= β Γ ( α )
α
σ 2=α β 2
Distribución exponencial
La variable aleatoria continua X tiene una distribución exponencial, con parámetro β ,
si su función de densidad está dada por:
{
1 −x/ β
e ; x >0
f ( x ; β )= β
0; en otro caso
Donde β >0.
Media:
μ= β
Varianza:
2 2
σ =β
β es el tiempo promedio entre eventos
Distribución Normal
Densidad de la variable aleatoria normal X
2
− ( x− μ)
1 2σ
2
f ( x )= e ;−∞< x <∞
√ 2 πσ
Media:
E ( X ) =μ
Varianza
Var ( X )=σ 2
( n−1 ) S 2
Y= 2
σ
tiene una distribución Chi-Cuadrado con ν=n−1 grados de libertad.
Sea Z una variable aleatoria normal estándar y Y una variable aleatoria chi-cuadrado
con ν grados de libertad. Si Z y Y son independientes, entonces la distribución de la
Z
variable aleatoria T = esta dada por la función de densidad
√Y /ν
( )
Γ [ ( ν+1 ) /2 ] − ( ν+1) /2
t2
h ( t )= 1+ ;−∞< t< ∞
Γ ( ν /2 ) √ πν ν
La distribución t se usa ampliamente en problemas relacionados con inferencias acerca
de la media de la población o en problemas que implican muestras comparativas (es
decir, en casos donde se trata de determinar si las medias de dos muestras son muy
X−μ
diferentes) el uso de la distribución t para el estadístico T = requiere que
S/ √ n
X 1 , X 2 , … , X n sean normales. El uso de la distribución t y la consideración del tamaño
de la muestra no se relacionan con el teorema del limite central. El uso de la
distribución normal estándar en vez de T para n ≥ 30 sólo implica, en este caso que S
es un estimador suficientemente bueno de σ .
Distribución Chi-Cuadrado
Es un caso especial de la distribución gamma y se obtiene con α =ν /2 y β=2, donde ν
es un entero positivo denominado como grados de libertad.
La variable aleatoria continua X tiene una distribución chi-cuadrado, con ν grados de
libertad, si su función de densidad está dada por:
{
1 ν/ 2−1 − x/2
x e ; x> 0
f ( x ; ν )= 2 ν/ 2
Γ ( ν /2 )
0 ;en otro caso
Media:
μ=ν
Varianza:
2
σ =2 ν
Demostración (pg. 217)
tiene una distribución chi cuadrado con ν=ν 1 + ν 2+ …+ν n grados de libertad.
( )
n 2
X i−μ
Y =∑
i=1 σ
Tiene una distribución chi-cuadrado con n grados de libertad ( ν=n).
Distribución F
Sean U y V dos variables aleatorias independientes que tienen distribuciones chi-
cuadrada con ν1 y ν 2 grados de libertad, respectivamente. Entonces, la distribución de
U /ν 1
la variable aleatoria F= es dada por la función de densidad
V / ν2
{ ( )
ν 1/ 2
ν1
Γ [ ( ν 1+ ν 2 ) / 2 ]
ν2 f
( ν1 /2 )−1
h ( f )= ; f >0
( )
Γ ( ν 1 /2 ) Γ ( ν 2 /2 ) ν1 f ( ν 1+ν 2) /2
1+
ν2
0;f ≤ 0
Distribuciones muestrales
Media muestral:
n
Xi
X =∑
i=1 n
i =1 n−1
[ (∑ ) ]
n n 2
1
n∑ Xi−
2 2
S= Xi
n ( n−1 ) i=1 i=1
1
X = ( X 1+ X 2+ …+ X n )
n
Media:
1
μ X = ( μ+ μ+ …+ μ )
n
1
μ X = ( nμ )
n
μ X =μ
Varianza:
1 2 2
2
σ X= 2
( σ +σ + …+ σ 2 )
n
1
σ 2X = 2
( n σ2)
n
2
2 σ
σ X=
n
Teorema del límite central
Si se toman muestras de una población con distribución desconocida ya sea finita o
infinita la distribución muestral de X aún será aproximadamente normal.
Si X es la media de una muestra aleatoria de tamaño n, tomada de una población con
media μ y varianza σ 2, entonces la forma límite de la distribución de
X−μ x X −μ
Z= =
σx σ
√n
a medida que n → ∞, es la distribución normal estándar N (0,1).
La aproximación normal para X por lo general será buena si:
μ X −X =μ1−μ 2
1 2
2 2 2
σ X − X =Var ( X 1−X 2) =Var ( X 1 ) +Var ( X 2 ) =σ X + σ X
1 2 1 2
σ 21 σ 21
σ 2X − X = +
1 2
n1 n2
σ X −X =
1
σ 21 σ 21
+
n1 n 2
2
√
Donde:
μ1=Media de la población 1
2
σ 1=Varianza de la población1
μ2=Media de la población 2
2
σ 2=Varianza de la población2
X 1 =Mediade lamuestra aleatoria de tamaño n 1
√
σ X −X
1 2 σ 21 σ 21
+
n 1 n2
( X 1− X 2 )−( μ 1−μ2 )
T '=
√
2 2
S1 S2
+
n1 n2
( )
2
S21 S22
+
n1 n2
ν=
( ) ( )
2 2
S21 S 22
( 1 ) n
n −1 + ( 2 ) n
n −1
1 2
( n1 −1 ) S 21
Y 1=
σ2
( n 2−1 ) S 22
Y 2=
σ2
Por la propiedad reproductiva de la distribución chi-cuadrado:
√ σ 2 σ2
+
n1 n 2
√
T=
( n1−1 ) S21 + ( n 2−1 ) S 22
σ2
n1 +n 2−2
( X 1− X 2 )−( μ 1−μ2 )
T=
√(
2 2
1 1 ( n1−1 ) S1 + ( n 2−1 ) S 2
+
n1 n2 )
n1 +n 2−2
( X 1− X 2 )−( μ 1−μ2 )
T=
(√ n1 + n1 ) S
1 2
2
p
i =1 n−1
2
( n−1 ) S 2 n ( xi −X )
=∑
σ2 i=1 σ2
Considerando:
n n
∑ ( xi −μ ) =∑ [ ( xi −X ) +( X −μ ) ]
2 2
i=1 i=1
n n
∑ ( xi −μ )2=∑ [ ( xi −X )2 +2 ( x i−X ) ( X −μ ) +( X −μ )2 ]
i=1 i=1
n n
∑ ( xi −μ ) =∑ [ ( xi −X ) +2 ( x i−X ) ( X −μ ) +( X −μ )
2 2 2
]
i=1 i=1
∑ ( A i ± B i )= ∑ A i ± ∑ B i ∑ c Ai =c ∑ A i
i=1 i=1 i=1 i=1 i=1
n n
n n n n
∑ ( xi −μ )2=∑ ( x i− X )2 + ∑ 2 ( x i−X ) ( X −μ ) +∑ ( X −μ )2
i=1 i=1 i=1 i=1
n n n
∑ ( xi −μ ) =∑ ( x i− X ) +2 ( X−μ ) ∑ ( x i− X ) +n ( X −μ )
2 2 2
n n
∑ ( xi −μ ) =∑ ( x i− X )2 +n ( X −μ )2
2
i=1 i=1
2 2
n
( x i−μ ) n
( x i− X ) n ( X −μ )2
∑ σ2
=∑
σ2
+
σ2
i=1 i=1
2
n
( x i−μ ) ( n−1 ) S2 ( X−μ )2
∑ σ2
=
σ2
+ 2
σ /n
i=1
Por la propiedad aditiva de la distribución Chi-Cuadrado.
m
χ 2g= χ 21 + χ 22 +…+ χ 2m ; g=∑ gi
i=1
2
n
( X−μ )2
( x i−μ )
Entonces si las variables aleatorias ∑ y 2 tienen una distribución Chi-
i=1 σ2 σ /n
cuadrado con n grados de libertad ( χ n ) y 1 grado de libertad ( χ 1) respectivamente la
2 2
( n−1 ) S 2
variable aleatoria 2 tiene una distribución Chi-Cuadrado con n−1 grados de
σ
libertad ( χ n−1) .
2
Media:
μ ^P=E ( ^
P ) =E
X
n
=
np
p ( )
μ ^P= p
Varianza:
2
σ ^P=Var ( P
n n2 ( )
^ ) =Var X = 1 Var ( X )= npq
n2
p(1−p)
σ 2^P=
n
Entonces la distribución será:
^p −p
Z=
√ p (1− p)
n