Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Poblaciones 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑋ത =
normales 𝑛 Poblaciones NO
normales
𝑋 ∼ 𝑁(𝜇; 𝜎 2 )
𝜎2
𝑋ത ∼ 𝑁 𝜇 ;
𝑛 MUESTRAS
SIEMPRE
GRANDES
Para cualquier
tamaño muestral n ഥ−𝝁
𝑿 n>30
𝝈 ∼ 𝑵(𝟎, 𝟏)
ൗ 𝒏
pequeña
𝑍 ∼ 𝑁(0,1)
Tamaño
de la
Tamaño
de la ? ?
muestra muestra
en 𝑋ത en 𝑋ത
grande
𝑍 ∼ 𝑁(0,1) 𝑍 ≈ 𝑁(0,1)
grande
𝑇 ≈ 𝑁(0,1) 𝑇 ≈ 𝑁(0,1)
6
N 20
Minitab
5
Frecuencia
4 𝑠Ƹ
3 𝑠Ƹ 2
2
0
24 28 32 36 40
AlgaeOr
Si 𝑋ത es normal y conocemos 𝜎…
𝜎 𝑠Ƹ
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2 𝑠Ƹ 2
𝑛
2
3
5
• Por tanto no podemos asumir que 𝑋ത se distribuye como una normal.
Frecuencia
0
24 28 32 36 40 44
Biocraft 𝜎
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛
𝑋ത − 𝜇 𝑋ത − 𝜇 Distribución
𝑍= ∼ 𝑁(0,1) 𝑇= ∼ t de Student
𝜎Τ 𝑛 𝑆መ Τ 𝑛
pequeña
Tamaño
de la
𝑇 ∼ 𝑡 𝑑𝑒 𝑠𝑡𝑢𝑑𝑒𝑛𝑡
?
muestra
en 𝑋ത
𝑇 ≈ 𝑁 0,1
grande
𝑇 ≈ 𝑁(0,1)
𝑇 ∼ 𝑡 𝑑𝑒 𝑠𝑡𝑢𝑑𝑒𝑛𝑡
Se diferencian en la zona de
las colas, que es justo donde
necesitamos tomar valores
para hacer inferencia
𝑋ത − 𝜇
𝑇= ∼ 𝑡𝑛−1
𝑆መ Τ 𝑛
• A medida que n crece, la distribución 𝑡𝑛−1 se va pareciendo cada vez más a la N(0,1).
• Por tanto, no hay contradicción con lo que se ha visto en el tema anterior para muestras grandes. No
obstante, si sabemos que la población es normal, es preferible usar siempre la 𝑡𝑛−1 .
𝑋ത − 𝜇
∼ 𝑡𝑛−1 𝑁(0,1)
𝑆መ Τ 𝑛 𝑛→∞
𝜎
Sˆ
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2 IC(1 − ) : X tn −1; / 2
𝑛
n
en lugar de 𝑧𝛼/2
Sˆ
IC(1 − ) : X tn −1; / 2
n
𝑡24;0.025 =? ?
Gráfica de distribución
T; df=24
y 𝛼=0.05
0,3
Densidad
0,2
𝑡24;0.025 =? ?
0,1
𝜶/2=0.025
0,025 0,025
0,0
-2,064 0 2,064
X 𝑡24;0.025 = 2.064
ESTADÍSTICA BÁSICA www.edbudep.com
16
𝑡24;0.025 = 2.064
𝑆መ Para n=25
𝐼𝐶(1 − 𝛼): 𝜇 ∈ 𝑋ሜ ± 𝑡24;0.025 y 𝛼=0.05
𝑛
3.164
𝐼𝐶(0.95): 𝜇 ∈ 9.77 ± 2.06
25
= (8.47,11.07)
t24;0.025 = 2.06
Usando la aproximación N(0,1) como si fuese para muestras grandes...
𝛼/2=0.025
z0.025 = 1.96
Vemos que, como 1.96<2.06, con la aproximación a la normal, el intervalo sale algo más estrecho, por lo que
su nivel de confianza ‘real’ será (ligeramente) inferior al ‘nominal’ del 95%
ESTADÍSTICA BÁSICA www.edbudep.com
19
Usando la t de Student: intervalo exacto. Su confianza es seguro del 95%
3.164
IC(0.95) : 9.77 2.06 = (8.47,11.07)
25
3.164
9.77 1.96 = (8.53,11)
25
2
3
Histograma de AlgaeOr
Normal
7
Media 31 ,95 Minitab
Desv.Est. 4,81 7
N 20
El histograma sí parece
6 a una normal. Como
son pocos datos, es 𝑠Ƹ
5
irregular, pero se ve
Frecuencia
4 simétrico, unimodal y
con forma aproximada
3
de campana
2
0
24 28 32 36 40
AlgaeOr
2 3
Sˆ
Intervalos de confianza de 95% IC(1 − ) : X tn −1; / 2
Media
n
Mediana
• Los intervalos basados en la t de Student son válidos para la normal, con cualquier tamaño muestral
• También valdrían para cualquier población si 𝑛 > 30 (muy similares a si uso Z)
Se hacen igual, con el mismo estadístico de contraste, que ahora tiene otra
distribución de referencia:
𝑋ത − 𝜇 𝑋ത − 𝜇
Z0 = ∼ 𝑁(0,1) 𝑇0 = ∼ 𝑡𝑛−1
𝜎Τ 𝑛 𝑆መ Τ 𝑛
Rechazo H0 Rechazo H0
H 0 : = 0 ; H1 : 0
Acepto H0
(a)
(a) − z / 2 z / 2
Poblaciones normales
Rechazo H0
Acepto H0
H 0 : 0 ; H1 : 0
(b)
(b)
z
PASO 3: tn −1;
𝑍0 ∼ 𝑁 0,1
H 0 : 0 ; H1 : 0 𝑇0 ∼ 𝑡𝑛−1 Rechazo H0 Acepto H0
(c)
−z
(c)
−tn −1;
Histograma de Gain
Normal
30 Media 282,3
Desv.Est. 27,69
N 1 00
25
20
Frecuencia
15
10
0
230 250 270 290 310 330 350 370
Gain
Los métodos de inferencia se basan en la distribución muestal del estimador del parámetro
Estimadores de 𝜎 2
n n
n n −1
sesgado (cuasivarianza)
insesgado
• Su notación es 𝜒𝑔2
𝑛
σ𝑛𝑖=1 𝑋𝑖 − 𝑋ሜ 2
መ 2
𝑆 = ⇒ 𝑋𝑖 − 𝑋ሜ 2
= (𝑛 − 1)𝑆መ 2
𝑛−1
𝑖=1
σ𝑛𝑖=1 𝑋𝑖 − 𝑋ത 2
2
∼ 𝜒𝑛−1
𝜎2 𝑛
σ𝑛𝑖=1 𝑋𝑖 − 𝑋ሜ 2
2
𝑆 = ⇒ 𝑋𝑖 − 𝑋ሜ 2
= 𝑛𝑆 2
𝑛
𝑖=1
𝑛𝑆 2 2
2
∼ 𝜒𝑛−1
𝜎
ESTADÍSTICA BÁSICA www.edbudep.com
33
Intervalos de confianza para σ²
𝑛 − 1 𝑠Ƹ 2 𝑛 − 1 𝑠Ƹ 2 2 𝑛𝑠 2 𝑛𝑠 2
𝐼𝐶(1 − 𝛼): 𝜎 2 ∈ 2 ; 2 𝐼𝐶(1 − 𝛼): 𝜎 ∈ 2 ;2
𝜒𝑛−1; 𝛼Τ2 𝜒𝑛−1;1−𝛼Τ2 𝜒𝑛−1; 𝛼Τ2 𝜒𝑛−1;1−𝛼Τ2
Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de
confianza al 99% para la varianza poblacional 𝜎 2
𝑛 − 1 𝑠Ƹ 2 𝑛 − 1 𝑠Ƹ 2
𝐼𝐶(1 − 𝛼): 𝜎 2 ∈ 2 ; 2
𝜒𝑛−1; 𝛼Τ2 𝜒𝑛−1;1−𝛼Τ2
El valor más bajo, para que salga
El valor más alto, para que salga
el extremo más alto
el extremo más bajo
x = 9.77 s = 3.164
ˆ s 2 = 10.01
ˆ
Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al
99% para la varianza poblacional 𝜎 2
24;0.995
2
= 9.89 24;0.005
2
= 45.6
24 3.165 2 24 3.165 2
IC (0.99) :
2
, IC (0.99) : 2 ( 5.27,24.29 )
45.6 9.89
Estadístico de contraste
(𝑛 − 1) መ2
𝑆 𝑛𝑆 2
Saldría el mismo
𝑋02 = 𝑋02 = 2 valor
𝜎02 𝜎0
Distribución de referencia
𝑋02 ∼ 𝜒𝑛−1
2
nS 2
X = 2
02
0
Acepto H0 Rechazo H0
𝐻0 ∶ 𝜎² ≤ 𝜎0²; 𝐻1: 𝜎² > 𝜎0²
(b)
(b) n2−1;
PASO 3:
Rechazo H0
Acepto H0
(c)
(c)
n2−1;1−
Rechazo H0
Con 100 datos sˆ 2 = 766.85
Acepto H0
( n − 1) sˆ 2 99 766.85
x =
2
= = 99.89
99;0.05
2
= 123.2 0
2
0 760
• La diferencia entre los datos y la hipótesis no es significativa (con nivel 5%) y No rechazamos H0
puede deberse al azar de la muestra.
• Los datos no muestran entonces suficiente evidencia para rechazar Ho
• No es tan improbable que de una población de varianza 760, una muestra
de 100 artículos tengan una cuasivarianza muestral de 766.85, es decir, de
6.85 unidades más. Es poca distancia.
2 3
Gráfica de distribución
Chi-cuadrada; df=99
0,030
0,025
0,020
Densidad
0,01 5
0,01 0
0,4560
0,005
0,000
99,89
X