Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MUESTREO ESTADÍSTICO
1. Muestreo estadístico
Hasta ahora se han tratado temas ligados a la teoría de probabilidades. El tema del
muestreo constituye un ingreso a la teoría de la estadística.
Sin embargo, lo señalado no es factible ya que se quiere, por ejemplo, vender las semillas;
aun cuando no se las quiera vender, se preferiría obtener una respuesta sin tanto esfuerzo.
1
Muestreo estadístico Rubén Medinaceli O.
Otra manera de lograr una respuesta sería plantar unas pocas semillas, esperar un tiempo,
y en base a los colores de estas pocas flores, predecir cuántas de los 10 millones de
semillas, producirán flores blancas.
Si por ejemplo se plantan 100 semillas y 40 de ellas producen flores blancas, se podría
afirmar que 40% de los 10 millones de semillas producirán flores blancas. Obviamente, no
se tendría ninguna seguridad sobre esta afirmación. Desde el punto de vista de la
estadística se podría llegar a una afirmación probabilística como la siguiente: el porcentaje
de semillas que producirán flores blancas es algún valor entre 35% y 45% y la probabilidad
que esto ocurra es igual al 90%.
La manera descrita es, en los hechos, la única factible. Este es un proceso de inferencia
inductiva. Nótese que no se tiene plena seguridad sobre la respuesta, aunque se siente
cierta confiabilidad en la respuesta en un sentido probabilístico.
Antes de continuar con la inferencia estadística, es importante decir algo sobre el otro tipo
de inferencia, la inferencia deductiva. Mientras las conclusiones que se logran a través de
la inferencia inductiva son probables, las conclusiones logradas con la inferencia deductiva
son conclusivas o definitivas.
Premisa mayor: Uno de los ángulos interiores de un triángulo rectángulo vale 90°
Este es un ejemplo de inferencia deductiva la cual es definida como un método para deducir
información (conclusión) a partir de hechos aceptados (premisas).
2
Muestreo estadístico Rubén Medinaceli O.
La función probabilidad, denotada por 𝑃(∙), es una función conjunto con dominio A (un
algebra de eventos) y codominio el intervalo (0, 1) que pertenece al conjunto de los números
reales (𝑅); que satisface los siguientes axiomas:
En el caso de la teoría axiomática de probabilidades, los hechos aceptados son los tres
axiomas.
Teorema
Luego,
𝑃(𝐴𝑐 ) = 1 − 𝑃(𝐴)
A Ac
𝐴 ∪ 𝐴𝑐 = 𝑆
𝑃(𝐴 ∪ 𝐴𝑐 ) = 𝑃(𝑆)
𝐷𝑒 𝑎𝑐𝑢𝑒𝑟𝑑𝑜 𝑎𝑙 𝐴3
3
Muestreo estadístico Rubén Medinaceli O.
𝐷𝑒 𝑎𝑐𝑢𝑒𝑟𝑑𝑜 𝑎𝑙 𝐴2
𝑃(𝐴) + 𝑃(𝐴𝑐 ) = 1
𝐸𝑛 𝑒𝑓𝑒𝑐𝑡𝑜,
𝑃(𝐴𝑐 ) = 1 − 𝑃(𝐴)
1.3.1. Definición
1.3.2. Definición
4
Muestreo estadístico Rubén Medinaceli O.
𝑓𝑋 (𝑥)
Población
de la
característica de
interés 𝜎2
Población
𝜇 𝑋
Población: 𝑓𝑋 (𝑥)
Parámetros: 𝜇, 𝜎 2
¡P r o b l e m a! ¡P r o b l e m a!
(Vinculado a la característica de interés) (Expresado en términos de los parámetros)
Muestra aleatoria:
(𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 )
Realización:
(𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛 )
¿Solución
al problema?
Análisis estadístico de
la realización
(Estadística
Descriptiva)
INFERENCIA
ESTADÍSTICA
(Estimación de parámetros)
(Pruebas de hipótesis)
5
Muestreo estadístico Rubén Medinaceli O.
1.3.3. Definición
fX(x)
σ2 ¿?
Población:
µ ¿? X
Muestra aleatoria: 𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏
Realización: 𝒙𝟏 , 𝒙𝟐 , 𝒙𝟑 , ⋯ , 𝒙𝒏
En estadística se dice que una variable aleatoria X se realiza cuando toma un valor
específico x.
a)
b)
6
Muestreo estadístico Rubén Medinaceli O.
1.4.1. Definición
Una variable aleatoria observable es una variable aleatoria que se puede medir y obtener
valores (realizaciones) de la variable aleatoria.
Por ejemplo, si una variable aleatoria observable X sigue una distribución normal con media
µ y varianza σ2, donde los parámetros µ y σ2 son desconocidos; X - µ no es un estadístico
ya que µ es un parámetro desconocido.
Es un estadístico.
1
𝑃 = {min[𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ] + 𝑚𝑎𝑥 [𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 ]}
2
También es un estadístico.
Sin embargo,
𝑇 = 𝑋̅ − 𝜇
7
Muestreo estadístico Rubén Medinaceli O.
1.4.2. Definición
Si 𝒓 = 𝟐
Recuerde que,
𝜇𝑟′ = 𝐸[𝑋𝑟 ]
Nótese que,
𝜇1′ = 𝐸[𝑋] = 𝜇𝑋
𝜇2′ = 𝐸[𝑋2 ]
1.4.3. Teorema
Luego,
𝐸[𝑀𝑟′ ] = 𝜇𝑟′
8
Muestreo estadístico Rubén Medinaceli O.
La esperanza de una constante por una variable es igual a la constante por la esperanza
de la variable, por tanto,
𝑛
1
𝐸[𝑀𝑟′ ] = 𝐸 [∑ 𝑋𝑖𝑟 ]
𝑛
𝑖=1
1.5.1. Definición
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1
1.5.2. Teorema
Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) con media µ
(desconocida) y varianza σ2 (desconocida).
Sea,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1
9
Muestreo estadístico Rubén Medinaceli O.
La media de la muestra.
Luego,
a)
𝐸[𝑋̅] = 𝜇𝑋̅ = 𝜇
b)
𝜎2
𝑉𝑎𝑟[𝑋̅] = 𝜎𝑋2̅ =
𝑛
a)
𝑛 𝑛 𝑛
1 1 1 1
𝐸[𝑋̅] = 𝐸 [ ∑ 𝑋𝑖 ] = 𝐸 [∑ 𝑋𝑖 ] = ∑ 𝐸[𝑋𝑖 ] = {𝐸[𝑋1 ] + 𝐸[𝑋2 ] + ⋯ + 𝐸[𝑋𝑛 ]}
𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1
Recuerde que,
Por tanto,
1 1
𝐸[𝑋̅] = {𝜇 + 𝜇 + ⋯ + 𝜇} = {𝑛𝜇} = 𝜇
𝑛 𝑛
b)
𝑛
1
𝑉𝑎𝑟[𝑋̅] = 𝑉𝑎𝑟 [ ∑ 𝑋𝑖 ]
𝑛
𝑖=1
𝑉𝑎𝑟[𝑎𝑋] = 𝑎2 𝑉𝑎𝑟[𝑋]
Por tanto,
𝑛
1
𝑉𝑎𝑟[𝑋̅] = 𝑉𝑎𝑟 [∑ 𝑋𝑖 ]
𝑛2
𝑖=1
10
Muestreo estadístico Rubén Medinaceli O.
Recordando que,
1 2 1 𝜎2
𝑉𝑎𝑟[𝑋̅] = {𝜎 + 𝜎 2 + ⋯ + 𝜎2} = {𝑛𝜎 2} =
𝑛2 𝑛2 𝑛
Sea
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1
la media de la muestra.
Vale decir,
11
Muestreo estadístico Rubén Medinaceli O.
𝑓𝑋 (𝑥)
σ2
µ X
Muestra aleatoria: (𝑿 𝟏 , 𝑿 𝟐 , 𝑿 𝟑 , ⋯ , 𝑿 𝒏 )
Media de la muestra:
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1
𝑨 𝒎𝒆𝒅𝒊𝒅𝒂 𝒒𝒖𝒆 𝒏 → ∞
𝑓𝑋̅ (. )
σ2 / n
µ ̅
𝑿
12
Muestreo estadístico Rubén Medinaceli O.
1.6.1. Definición
1.6.2. Teorema
Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) con media µ y
varianza σ2.
Sea,
𝑛
1
𝑆2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1
La varianza de la muestra.
Luego,
a)
𝐸[𝑆 2 ] = 𝜎 2
b)
1 𝑛−3 4
𝑉𝑎𝑟[𝑆 2 ] = (𝜇4 − 𝜎 ) ; 𝑝𝑎𝑟𝑎 𝑛 > 1
𝑛 𝑛−1
a)
13
Muestreo estadístico Rubén Medinaceli O.
𝑛 𝑛 𝑛
𝑛 𝑛
𝑖=1 𝑖=1
0
𝑛 𝑛 𝑛
𝑛 𝑛
De donde,
𝑛 𝑛
𝑛 𝑛
1 1 𝜎2
𝐸[𝑆 2 ] = {∑ 𝑉𝑎𝑟[𝑋] − 𝑛𝑉𝑎𝑟[𝑋̅]} = {∑ 𝜎 2 − 𝑛 }
𝑛−1 𝑛−1 𝑛
𝑖=1 𝑖=1
1 1
𝐸[𝑆 2 ] = {𝑛𝜎 2 − 𝜎 2 } = 𝜎 2 (𝑛 − 1) = 𝝈𝟐
𝑛−1 𝑛−1
14
Muestreo estadístico Rubén Medinaceli O.
2.1.1. Definición
Si X es una variable aleatoria cuya función de densidad de probabilidad viene dada por:
1 1 𝑥−𝜇 2
− 2( 𝜎 )
𝑓𝑋 (𝑥) = 𝑒 ; −∞ ≤ 𝑥 ≤ ∞
√2𝜋 𝜎
Se dice que la variable aleatoria X sigue una distribución normal con media µ y varianza
σ2; y se denota por 𝑿 ~ 𝑵(𝝁; 𝝈𝟐 ).
fX(x)
σ2
𝑿 ~ 𝑵(𝝁; 𝝈𝟐 )
µ
Nótese que:
2.1.2. Teorema
Sea X una variable aleatoria que sigue una distribución normal con media µ y varianza
σ2.
15
Muestreo estadístico Rubén Medinaceli O.
Luego, reiterando:
a)
𝐸[𝑋] = 𝜇𝑋 = 𝜇
b)
𝑉𝑎𝑟[𝑋] = 𝜎𝑋2 = 𝜎 2
2.1.3. Definición
Si Z es una variable aleatoria que sigue una distribución normal con media µ = 0 y
varianza σ2 = 1, se dice que la variable aleatoria Z sigue una distribución normal
estandarizada y se denota por 𝒁 ~ 𝑵(𝟎; 𝟏). Esto es,
fZ(z)
σ2 = 1
𝒁 ~ 𝑵(𝟎, 𝟏)
µ=0
2.1.4. Teorema
Sea,
𝑋 ~ 𝑁(𝜇; 𝜎 2 )
𝑋−𝜇
𝑍=
𝜎
Luego,
𝑍 ~ 𝑁(0; 1)
Este teorema es muy importante para operar con la distribución normal. En palabras,
dice que, con el cambio de variable señalado, cualquier distribución normal puede
ser convertida en una distribución normal estandarizada
16
Muestreo estadístico Rubén Medinaceli O.
La pregunta inmediata es: ¿para que necesitamos convertir una distribución normal
cualquiera en una distribución normal estandarizada?
1.1.1. Ejercicio 1
Problema:
Sea,
𝑋 ~ 𝑁(10; 9)
Solución:
Se conoce que la variable aleatoria X sigue una distribución normal con media µ = 10 y
varianza σ2 = 9; esto es,
𝒇𝑿 (𝒙)
P(X ≤ 12)
σ2 = 9; σ =3
𝑋 ~ 𝑁(10; 9)
µ = 10
x0 = 12
Por tanto,
12
1 1 𝑥−10 2
− 2( 3 )
𝑃(𝑋 ≤ 12) = ∫ 𝑒 𝑑𝑥
√2𝜋3
−∞
17
Muestreo estadístico Rubén Medinaceli O.
𝑋 − 𝜇 12 − 10
𝑃(𝑋 ≤ 12) = 𝑃 ( ≤ ) = 𝑃(𝑍 ≤ 0,67)
𝜎 3
𝒇𝑿 (𝒙)
P(X ≤ 12)
σ2 = 9; σ =3
𝑿 ~ 𝑵(𝟏𝟎; 𝟗)
µ = 10
x0 = 12
𝒇𝒁 (𝒛)
P(Z ≤ 0,67)
𝑿−𝝁
𝒁= ~𝑵(𝟎; 𝟏)
𝝈
µ=0
z0 = 0,67
El acceso a la tabla (cualquier libro de estadística tiene esta tabla, la que se muestra es una
parte de la tabla) es muy sencillo, tal como se muestra a continuación:
z0 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
18
Muestreo estadístico Rubén Medinaceli O.
Por tanto,
𝑋 − 𝜇 12 − 10
𝑃(𝑋 ≤ 12) = 𝑃 ( ≤ ) = 𝑃(𝑍 ≤ 0,67) = 𝟎, 𝟕𝟒𝟖𝟔
𝜎 3
2.2.1. Teorema
Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) que sigue una
distribución normal con media 𝜇 y varianza 𝜎 2 .
Sea,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1
La media de la muestra.
Luego,
𝑋̅ es una variable aleatoria que sigue una distribución normal con media µ y varianza σ2/n
Este es un teorema muy parecido al teorema del límite central. Sin embargo, en el teorema
del límite central la forma de la distribución de la población es cualquiera; en este teorema
es normal. En el teorema del límite central, la media de la muestra 𝑋̅ converge, a medida
que 𝑛 → ∞, a una distribución normal; en este teorema, 𝑋̅ tiene una distribución normal.
2.3.1. Definición
Si X es una variable aleatoria cuya función de densidad de probabilidad viene dada por:
1 1 𝑘⁄2 𝑘−1 − 1𝑥
𝑓𝑋 (𝑥) = ( ) 𝑥 2 𝑒 2 ; 𝑥 ≥ 0; 𝑘 𝑒𝑠 𝑢𝑛 𝑒𝑛𝑡𝑒𝑟𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜
𝛤(𝑘⁄2) 2
Se dice que la variable aleatoria X sigue una distribución chi-cuadrada con k grados de
libertad y se denota por: 𝑋 ~ 𝑿𝟐𝒌
19
Muestreo estadístico Rubén Medinaceli O.
𝛤(𝑡 + 1) = 𝑡𝛤(𝑡)
Si t = n (un entero)
𝛤(𝑛 + 1) = 𝑛!
2.3.2. Teorema
Sea 𝑋 ~ 𝑿2𝑘
Luego,
a)
𝐸[𝑋] = 𝑘
b)
𝑉𝑎𝑟[𝑋] = 2𝑘
𝑓𝑋 (𝑥)
Var [X] = 2k
0 E[X] = k 𝑋 ~ 𝑿𝟐𝒌
20
Muestreo estadístico Rubén Medinaceli O.
Problema:
2
Sea 𝑋 ~ 𝑿10
Solución:
𝑓𝑋 (𝑥)
P(X ≤ 16,0)
16
1 1 5 4 − 1𝑥
𝑃(𝑋 ≤ 16,0) = ∫ ( ) 𝑥 𝑒 2 𝑑𝑥
𝛤(5) 2
0
G = P(X ≤ x0)
0 x0 𝑋 ~ 𝑿𝟐𝒌
𝒌 𝑮
0,005 0,010 0,025 0,050 0,100 0,250 0,500 0,750 0,900 0,950 0,975 0,990 0,995
8 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,2 13,4 15,5 17,5 20,1 22,0
9 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,4 14,7 16,9 19,0 21,7 23,6
10 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,5 16,0 18,3 20,5 23,2 25,2
11 2,60 3,05 3,82 4,57 5,58 7,58 10,30 13,7 17,3 19,7 121,9 24,7 26,8
12 3,07 3,57 4,40 5,23 6,30 8,44 11,30 14,8 18,5 21,0 23,3 26,2 28,3
13 3,57 4,11 5,01 5,89 7,04 9,30 12,30 16,0 19,8 22,4 24,7 27,7 29,8
21
Muestreo estadístico Rubén Medinaceli O.
Se busca la fila correspondiente a los grados de libertad (en este caso k =10); en esta fila
se busca el valor correspondiente a x0 (en este caso x0 = 16,0); finalmente se obtiene la
probabilidad correspondiente en la fila de valores de G. En este caso,
Si la tabla no incluye el valor x0 de interés, hay que recurrir a una interpolación lineal
tomando el inmediato inferior y el inmediato superior. Nótese que la tabla también puede
ser utilizada para encontrar x0 cuando se conoce G.
2.3.4. Teorema
Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) que sigue una
distribución normal con media µ y varianza σ2.
Sea,
𝑛
𝑋𝑖 − 𝜇 2
𝑈 = ∑( )
𝜎
𝑖=1
Luego,
𝑈 ~ 𝑿𝟐𝒏
2.3.5. Teorema
Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) que sigue una
distribución normal con media µ y varianza σ2.
Sea,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1
La media de la muestra
Sea,
𝑛 2
𝑋𝑖 − 𝑋̅
𝑈 = ∑( )
𝜎
𝑖=1
Luego,
22
Muestreo estadístico Rubén Medinaceli O.
𝑈 ~ 𝑿𝟐𝒏−𝟏
Con respecto al teorema anterior, éste reemplaza la media de la población (µ) con la media
de la muestra (𝑿̅ ); y señala que por esta razón la distribución de U pierde un grado de
libertad.
2.3.6. Teorema
Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) que sigue una
distribución normal con media µ y varianza σ2.
Sea,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1
La media de la muestra
Sea,
𝑛
1
2
𝑆 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1
La varianza de la muestra
Sea,
(𝑛 − 1)𝑆 2
𝑈=
𝜎2
Luego,
𝑈 ~ 𝑿𝟐𝒏−𝟏
Recuerde que este punto se inició indicando que se buscaba la distribución de S2. No se
ha logrado este propósito. Sin embargo, se ha obtenido la distribución de una variable
aleatoria U de la que S2 es parte; esto es suficiente para los fines prácticos.
2.4.1. Definición
Si X es una variable aleatoria cuya función de densidad de probabilidad viene dada por:
𝛤[(𝑘 + 1)⁄2] 1 1
𝑓𝑋 (𝑥) = ; −∞ ≤ 𝑥 ≤ ∞ ; 𝑘 𝑒𝑠 𝑢𝑛 𝑒𝑛𝑡𝑒𝑟𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜
⁄
𝛤(𝑘 2 ) √𝑘𝜋 (1 + 𝑥 𝑘)(𝑘+1)⁄2
2 ⁄
23
Muestreo estadístico Rubén Medinaceli O.
Se dice que la variable aleatoria X sigue una distribución t de estudiante con k grados
de libertad y se denota por: 𝑿 ~ 𝒕𝒌
2.4.2. Teorema
Sea 𝑿 ~ 𝒕𝒌
Luego,
a)
𝐸[𝑋] = 0 ; 𝑠𝑖 𝑘 > 2
b)
𝑘
𝑉𝑎𝑟[𝑋] = ; 𝑠𝑖 𝑘 > 2
𝑘−2
fX(x)
σ2 = k / (k-2)
𝑿 ~ 𝒕𝒌
µ=0
2.4.3. Ejercicio 2
Problema:
Sea X una variable aleatoria que sigue una distribución t de estudiante con cinco (5)
grados de libertad (𝑋 ~ 𝑡5 ).
24
Muestreo estadístico Rubén Medinaceli O.
Calcular la P (X ≤ 2,015).
Solución:
Si 𝑋 ~ 𝑡5
fX(x)
P(X ≤ 2,015)
𝑿 ~ 𝒕𝟓
µ=0
x0=2,015
Por tanto,
2,015
𝛤[3] 1 1
𝑃(𝑋 ≤ 2,015) = ∫ 𝑑𝑥
𝛤(5⁄2) √5𝜋 (1 + 𝑥 2 ⁄5)3
−∞
Es una integral compleja que nadie desea resolver. Por tanto, se debe recurrir a una
aproximación numérica la misma que viene en una tabla incluida en cualquier libro de
estadística. A continuación, se muestra una parte de esta tabla:
25
Muestreo estadístico Rubén Medinaceli O.
fX(x)
α = P (X ≥ x0)
0 x0 𝑋 ~ 𝑡𝑘
k 𝜶
0,10 0,05 0,025 0,01 0,005
3 1,638 2,353 3,182 4,541 5,841
4 1,533 2,132 2,776 3,747 4,604
5 1,476 2,015 2,571 3,365 4,032
6 1,440 1,943 2,447 3,143 3,707
7 1,415 1,895 2,365 2,998 3,499
8 1,397 1,860 2,306 2,896 3,355
El uso de la tabla es muy sencillo. Con los grados de libertad (k = 5, en el presente caso)
se ubica la fila de interés; en la misma se busca el valor de x0 (x0 = 2,015, en el presente
caso); el valor de α [P (X ≥ x0)] se encuentra en la primera fila de la tabla. Por tanto,
Está permitida la interpolación lineal. La tabla también puede ser utilizada para encontrar el
valor de x0 que le corresponde a un cierto valor de α.
2.4.4. Teorema
Sea,
𝑍 ~ 𝑁(0,1)
Sea,
𝑈 ~ Ӽ2𝑘
Sea,
𝑍
𝑇=
√𝑈
𝑘
Luego,
26
Muestreo estadístico Rubén Medinaceli O.
𝑇 ~ 𝑡𝑘
Este teorema señala el camino para lograr una distribución t de estudiante con k grados
de libertad. Dice que el cociente de una distribución normal estandarizada sobre la raíz
cuadrada de una distribución chi-cuadrada dividida por sus grados de libertad. La
distribución t de estudiante así formada tiene los mismos grados de libertad que la
distribución chi-cuadrada.
Este teorema resulta importante a la hora de buscar estadísticos requeridos por la inferencia
estadística.
Ejemplo
Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población 𝑓𝑋 (𝑥) que sigue una
distribución normal con media µ y varianza σ2.
fX(x)
σ2
𝑿 ~ 𝑵(𝝁; 𝝈𝟐 )
µ
𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏
Sea,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1
La media de la muestra
Sea,
𝑛
1
𝑆2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1
27
Muestreo estadístico Rubén Medinaceli O.
La varianza de la muestra
Se sabe que,
𝜎2
𝑋̅ ~𝑁 (𝜇; )
𝑛
𝑋̅ − 𝜇
𝑍= 𝜎 ~ 𝑁(0; 1)
√𝑛
(𝑛 − 1)𝑆 2
𝑈= ~ 𝑿2𝑛−1
𝜎2
Recordando que,
𝑍
𝑇= ~𝑡𝑘
√𝑈
𝑘
Donde,
𝑍 ~ 𝑁(0; 1)
𝑈 ~ 𝑿2𝑘
𝑋̅ − 𝜇
𝜎
𝑇= √𝑛 ~ 𝑡𝑛−1
(𝑛 − 1)𝑆 2
√ 𝜎2
𝑛−1
Vale decir,
𝑋̅ − 𝜇
𝑇= ~ 𝑡𝑛−1
𝑆
√𝑛
Este estadístico será muy útil a la hora de efectuar inferencia estadística vinculada a la
media de la población 𝜇.
28
Muestreo estadístico Rubén Medinaceli O.
2.5. Distribución F
2.5.1. Definición
Si X es una variable aleatoria cuya función de densidad de probabilidad viene dada por:
Se dice que la variable aleatoria X sigue una distribución F con m y n grados de libertad,
y se denota por:
𝑿 ~ 𝑭𝒎; 𝒏
2.5.2. Teorema
Sea,
𝑋 ~ 𝐹𝑚; 𝑛
Luego,
i)
𝑛
𝐸[𝑋] = ; 𝑠𝑖 𝑛 > 2
𝑛−2
ii)
2𝑛2 (𝑚 + 𝑛 − 2)
𝑉𝑎𝑟[𝑋] = ; 𝑠𝑖 𝑛 > 4
𝑚(𝑛 − 2)2 (𝑛 − 4)
fX(x)
2𝑛2 (𝑚+𝑛−2)
𝜎2 =
𝑚(𝑛−2)2 (𝑛−4)
𝑛
0 𝜇= 𝑋 ~ 𝐹𝑚;𝑛
𝑛−2
29
Muestreo estadístico Rubén Medinaceli O.
2.5.3. Ejercicio 3
Problema:
Sea X una variable aleatoria que sigue una distribución F con 4 y 6 grados de libertad
(𝑋 ~ 𝐹4;6 ).
Solución:
Si 𝑋 ~ 𝐹4;6
fX(x)
P(X ≤ 6,23)
0 𝑋 ~ 𝐹4;6
x0 = 6,23
6,23
𝛤[(4 + 6)⁄2] 4 4⁄2 𝑥 (4−2)⁄2
𝑃(𝑋 ≤ 6,23) = ∫ ( ) 𝑑𝑥
𝛤[4⁄2]𝛤[6⁄2] 6 [1 + (4⁄6)𝑥](4+6)⁄2
0
Es una integral difícil, nadie desea resolverla analíticamente; por tanto, se debe recurrir a
una aproximación numérica que en este caso viene en una tabla, incluida en cualquier libro
de estadística. A continuación, se muestra una parte de dicha tabla:
30
Muestreo estadístico Rubén Medinaceli O.
𝑮 = 𝑷(𝑿 ≤ 𝒙𝟎 )
0 𝑥0 𝑋 ~ 𝐹𝑚;𝑛
G n m
2 3 4 5 6 7
0,900 5 3,78 3,62 3,52 3,45 3,40 3,37
0,950 5,79 5,41 5,19 5,05 4,95 4,88
0,975 8,43 7,76 7,39 7,15 6,98 6,85
0,990 13,30 12,10 11,40 11,00 10,70 10,50
0,995 18,30 16,5 15,60 14,90 14,50 14,20
0,900 6 3,46 3,29 3,18 3,11 3,05 3,01
0,950 5,14 4,76 4,53 4,39 4,28 4,21
0,975 7,26 6,60 6,23 5,99 5,82 5,70
0,990 10,90 9,78 9,15 8,75 8,47 8,26
0,995 14,50 12,9 12,00 11,50 11,10 10,80
0,900 7 3,26 3,07 2,96 2,88 2,83 2,78
0,950 4,74 4,35 4,12 3,97 3,87 3,79
0,975 6,54 5,89 5,52 5,29 5,12 4,99
0,990 9,55 8,45 7,85 7,46 7,19 6,99
0,995 12,4 10,90 10,10 9,52 9,16 8,89
𝐹𝑚;𝑛 ≠ 𝐹𝑛;𝑚
En el presente caso,
Cada libro tiene su propio formato para esta y las tablas anteriores; sin embargo, una
revisión cuidadosa a la tabla facilita su acceso.
2.5.4. Teorema
Sea,
𝑈 ~ 𝑿2𝑚
31
Muestreo estadístico Rubén Medinaceli O.
Sea,
𝑉 ~ 𝑿2𝑛
Sean
Sea,
𝑈
𝐹= 𝑚
𝑉
𝑛
Luego,
𝐹 ~ 𝐹𝑚; 𝑛
2.5.5. Ejercicio 4
Problema:
Si T es una variable aleatoria que sigue una distribución t de estudiante con k grados
de libertad ( 𝑇 ~ 𝑡𝑘 ).
Obtener la distribución de T2
Solución:
Si 𝑇 ~ 𝑡𝑘
𝑍
𝑇=
√𝑈
𝑘
Donde,
𝑍 ~ 𝑁(0; 1)
𝑈 ~ Ӽ2𝑘
Por tanto,
32
Muestreo estadístico Rubén Medinaceli O.
𝑍2
𝑇2 = 1
𝑈
𝑘
Donde,
𝑍 2 ~ Ӽ12
𝑇 2 ~ 𝐹1; 𝑘
2.5.6. Ejercicio 5
Problema:
Sea X1, X2 una muestra aleatoria de una población que sigue una distribución normal
estandarizada (µ = 0; σ2 = 1).
a)
𝑋1 + 𝑋2
𝑌=
√2
b)
𝑋1 + 𝑋2
𝑅=
√(𝑋1 − 𝑋2 )2
33
Muestreo estadístico Rubén Medinaceli O.
Solución:
fX(x)
σ2 = 1
𝑋 ~ 𝑁(0; 1)
µ=0
X1, X2
𝑋1 ~ 𝑁(0; 1) 𝑦 𝑋2 ~ 𝑁(0; 1)
Por tanto,
1 1 1 1 1 1
𝑋1 + 𝑋2 ~ 𝑁 [ (0) + (0); (1) + (1)] ~ 𝑁(0; 1)
√2 √2 √2 √2 2 2
1 1 1 1 1 1
𝑋1 − 𝑋2 ~ 𝑁 [ (0) − (0); (1) + (1)] ~ 𝑁(0; 1)
√2 √2 √2 √2 2 2
En consecuencia,
34
Muestreo estadístico Rubén Medinaceli O.
a)
𝑋1 + 𝑋2
𝑌= ~ 𝑁(0; 1)
√2
b)
𝑋 + 𝑋2
𝑋1 + 𝑋2 √2 ( 1 )
𝑁(0; 1)
𝑅= = √2 ~ ~ 𝑡1
√(𝑋1 − 𝑋2 )2 𝟐
𝑋 − 𝑋2 2 𝑿
√ 𝟏
√2√( 1 ) 1
√2
2.5.7. Ejercicio 6
Problema:
Sea X1, X2 una muestra aleatoria de una población que sigue una distribución normal
estandarizada (µ = 0; σ2 = 1).
Sea Y1, Y2 una muestra aleatoria de una población que sigue una distribución normal
estandarizada (µ = 0; σ2 = 1).
Sean 𝑋̅ 𝑦 𝑌̅ las medias de las muestras correspondientes.
Sean 𝑆𝑋2 𝑦 𝑆𝑌2 las varianzas de las muestras correspondientes
𝑋̅ − 𝑌̅
𝑃=
2 2
√𝑆𝑋 + 𝑆𝑌
2
Solución:
fX(x)
σ2 = 1
𝑋 ~ 𝑁(0; 1)
µ=0
X1, X2
35
Muestreo estadístico Rubén Medinaceli O.
𝑋1 ~ 𝑁(0; 1) 𝑦 𝑋2 ~ 𝑁(0; 1)
1
𝑋̅ ~ 𝑁 (0; )
2
(2 − 1)𝑆𝑋2 𝑆𝑋2
𝑈= = = 𝑆𝑋2 ~ 𝑿𝟐𝟏
𝜎2 1
fY(y)
σ2 = 1
𝑌 ~ 𝑁(0; 1)
µ=0
Y1, Y2
𝑌1 ~ 𝑁(0; 1) 𝑦 𝑌2 ~ 𝑁(0; 1)
1
𝑌̅ ~ 𝑁 (0; )
2
(2 − 1)𝑆𝑌2 𝑆𝑌2
𝑉= = = 𝑆𝑌2 ~ 𝑿𝟐𝟏
𝜎2 1
1 1
(𝑋̅ − 𝑌̅ ) ~ 𝑁 (0 − 0; + ) ~ 𝑁(0; 1)
2 2
Por tanto,
𝑋̅ − 𝑌̅ 𝑁(0; 1)
𝑃= ~ ~ 𝑡2
2
√𝑆𝑋 + 𝑆𝑌2 √Ӽ2
2
2 2
36
Muestreo estadístico Rubén Medinaceli O.
2.5.8. Ejercicio 7
Problema:
Sea (𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , ⋯ , 𝑿𝒏 ) una muestra aleatoria de una población que sigue una distribución
normal con media 𝜇𝑋 y varianza 𝜎 2 .
Sea (𝒀𝟏 , 𝒀𝟐 , 𝒀𝟑 , ⋯ , 𝒀𝒎 ) una muestra aleatoria de una población que sigue una distribución
normal con media 𝜇𝑌 y varianza 𝜎 2 .
Encontrar la distribución de
𝑆𝑋2
𝑅=
𝑆𝑌2
Solución
𝑛
1
𝑆𝑋2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1
𝑚
1
𝑆𝑌2 = ∑(𝑌𝑖 − 𝑌̅ )2
𝑚−1
𝑖=1
(𝑛 − 1)𝑆𝑋2
𝑈= ~ Ӽ2𝑛−1
𝜎2
(𝑚 − 1)𝑆𝑌2
𝑉= ~ Ӽ2𝑚−1
𝜎2
Se conoce que,
𝑈
𝐹 = − 1 ~ 𝐹𝑛−1;𝑚−1
𝑛
𝑉
𝑚−1
Por tanto,
(𝑛 − 1)𝑆𝑋2
𝑈 𝜎2
𝑛−1 = 𝑛−1 𝑆𝑋2
= = 𝑅 ~ 𝐹𝑛−1; 𝑚−1
𝑉 (𝑚 − 1)𝑆𝑌2 𝑆𝑌2
𝑚−1 𝜎2
𝑚−1
37
Muestreo estadístico Rubén Medinaceli O.
Ejercicios propuestos
1.
Sea 𝑋 ~ 𝐹𝑚;𝑛
1
Sea 𝑌 =
𝑋
¿Cuál es la distribución de Y?
2.
Sea X1, X2 una muestra aleatoria de una población que sigue una distribución normal con
µ = 0 y σ2 = 1.
Sea Y1, Y2 una muestra aleatoria de una población que sigue una distribución normal con
µ = 1 y σ2 =1
3.
Si X1, X2 es una muestra aleatoria de una población que sigue una distribución normal con
µ = 0 y σ2 = 1.
4.
Sea X1, X2 una muestra aleatoria de una población que sigue una distribución normal
estandarizada (µ = 0; σ2 = 1).
Sea Y1, Y2 una muestra aleatoria de una población que sigue una distribución normal
estandarizada (µ = 0; σ2 = 1).
Sean 𝑋̅ 𝑦 𝑌̅ las medias de las muestras correspondientes.
Sean 𝑆𝑋2 𝑦 𝑆𝑌2 las varianzas de las muestras correspondientes
Si,
𝑋̅ − 𝑌̅
𝑃=
2 2
√𝑆𝑋 + 𝑆𝑌
2
38