Ejercicio 102 - Inferencia

Inferencia Estadı́stica
- Ejercicio 102 (Notas de Clase) -

David Santiago Pérez Barrios
June 3, 2020
Ejercicio 102: En la siguiente tabla, se presentan los valores de extracto de malta provenientes de maltas
de cebada Kindred cultivada en 20 localidades en los viveros de cebada del un valle en un año particular,
expresados en porcentaje de base seca.
Table 1: Porcentaje de base seca, ejemplo 102.

77.7 76.0 76.9 74.6 74.7 76.5 74.2
75.4 76.0 73.9 77.4 76.6 77.3 74.3
77.5 74.2 76.1 76.5 73.8 76.4
1. Utilice el test de Kolmogorov-Smirnov para verificar si los datos se pueden asumir que son realiza-
ciones de una variable aleatoria X con distribución normal. Utilice α = 0.10. Presente la distribución
empı́rica y la distribución teórica en una tabla.
Para el desarrollo de este numeral, haremos uso de los siguientes enunciados:
• La distribución empı́rica está dada por:

número de valores en la muestra ≤ x
S(X) =
n
• F ∗ (x) corresponde a la distribución normal con media µ y varianza σ 2 . Para facilidad en la
realización del ejercicio, utilizaremos el programa Excel, en donde haremos uso de la función
"DISTR.NORM(x,µ,σ,ACUMULADO)", teniendo en cuenta los siguientes valores:
20
1
X 77.7 + 76.0 + 76.9 + ... + 73.8 + 76.4 1516
(a) µ = 20 xi = = = 75.8.
20 20
i=1
v
u 20
√ uX (xi − x)2 q q √
(b) σ = σ2 = t = 4+3.61+2.56+...+2.89+3.61
20 = 32.46
20 = 1.623 ≈ 1.274.
20
i=1
(c) Como estamos hallando la función F ∗ (x), es decir la función de distribución acumulada para la
normal, en la sección de "ACUMULADO" dentro de la función, siempre será verdadera.
• Por el test de Kolmogorov - Smirnov, tenemos que el estadı́stico T , consiste en la distancia más grande
entre S(x) y F ∗ (x), en dónde el estadı́stico está dado por:
T = sup |F ∗ (x) − S(x)|

x
1
Las hipótesis a considerar son
H0 : F (x) = F ∗ (x) vs Ha : F (x) 6= F ∗ (x).
Se rechaza H0 al nivel de signicancia α si
T > wn,1−α
con wn,1−α dado por los cuantiles del test estadı́stico de Kolmogorov,
En la siguiente tabla se encuentran el valor de z para cada variable, como la distribución Empı́rica
S(x), y la distribución Teórica F ∗ (x) = Φ(x) correspondiente a cada valor de x de extracto de malta
provenientes de maltas de cebada Kindred.
x 73.8 73.9 74.2 74.3 74.6 74.7 75.4 76.0 76.1 76.4 76.5 76.6 76.9 77.3 77.4 77.5 77.7
z = x−µσ
-1.570 -1.491 -1.256 -1.177 -0.942 -0.863 -0.314 0.157 0.235 0.471 0.549 0.628 0.863 1.177 1.256 1.334 1.491
S(x) 0,05 0,1 0,2 0,25 0,3 0,35 0,4 0,5 0,55 0,6 0,7 0,75 0,8 0,85 0,9 0,95 1
F ∗ (x) 0,058 0,068 0,105 0,120 0,173 0,194 0,377 0,562 0,593 0,681 0,709 0,735 0,806 0,880 0,895 0,909 0,932
|F ∗ (x) − S(x)| 0,008 0,032 0,095 0,130 0,127 0,156 0,023 0,062 0,043 0,081 0,009 0,015 0,006 0,030 0,005 0,041 0,068
En la tabla anterior se observa que T = 0.156. Si α = 0.10, de la tabla de Kolmogorov se tiene

que wn,1−α = w20,0.90 = 0.26473 por tanto T < w y se concluye que no hay suficientes evidencias
para considerar que la distribución muestral de los datos asociados a los valores de extracto de malta
provenientes de maltas de cebada Kindred, no son realizaciones de una distribución normal.
2. Teniendo en cuenta que el porcentaje toma valores entre 0 y 1, utilice el test de Kolmogorov-Smirnov
para verificar si los datos se pueden asumir que son realizaciones de una variable aleatoria X con
distribución beta. Si los parámetros de la distribución beta son a y b,
Γ(a + b) a−1
f (x; a, b) = x (1 − x)b−1
Γ(a)Γ(b)
a ab
con E(X) = a+b
y V ar(X) = (a+b)2 (a+b+1)
.
Para el desarrollo de este ejercicio, haremos uso del método de momentos para calcular el valor de
los parámetros a y b. Por hipótesis se tiene que:
a ab
E(X) = y V ar(X) =
a+b (a + b)2 (a + b + 1)
luego, teniendo en cuenta que V ar(X) = E(X 2 ) − [E(X)]2 , entonces
V ar(X) = E(X 2 ) − [E(X)]2
2
ab 2 a
= E(X ) −
(a + b)2 (a + b + 1) a+b
2
ab a
+ = E(X 2 )
(a + b) (a + b + 1) (a + b)2
2
(ab)(a + b)2 + (a2 )(a + b)2 (a + b + 1)

= E(X 2 )
(a + b)4 (a + b + 1)
(ab) + (a2 )(a + b + 1)
2
= E(X 2 )
(a + b) (a + b + 1)
a3 + a2 + a2 b + ab
= E(X 2 )
(a + b)2 (a + b + 1)
2
Igualando el primer momento poblacional al primer momento muestral (x),
a a a
E(X) = x −→ = x −→ b a + bb) −→ a + bb −→ −b
b b b
a = x (b =b a = bb
a+b
b b x x
Luego, igualando el segundo momento poblacional al segundo momento muestral, se tiene que,
n
2 1X 2
E(X ) = x
n i=1 i
n
a3 + b
b a2 + b a2 b + b
abb 1X 2
= x
a + bb)2 (b
(b a + bb + 1) n i=1 i
n
a2 xba − b a xba − b

a3 + b
b a2 + b a +b a 1X 2
= x
n i=1 i
2
a + xba − b a + xba − b

b a b a +1
3 2 n
ba3 + ba2 + bax − b a3 + bax − ba2 1X 2
= x
a 2 b n i=1 i
b
a+x
x x
a3 +ba2 n
b
x 1X 2
= x
a3 +b
b
x3
a2 x n i=1 i
n
x3 (b
a3 + b
a2 ) 1X 2
= x
a3 + b
x (b a2 x) n i=1 i
n
x2 · b
a2 · (b
a + 1) 1X 2
= x
a2 · (b
b a+ x) n i=1 i
n
x2 · (b
a + 1) 1X 2
= x
a+x
b n i=1 i
n
1X 2
x2 · (b
a + 1) = x · (b
a + x)
n i=1 i
n n
2 aX 2 x 2
bX
x2
b
a x +x = x +
n i=1 i n i=1 i
b
n n
2 aX 2 x 2
bX
x2i
b
a x +x =
b xi +
n i=1 n i=1
n n
aX 2 x bX
a x2 − x2 − x2
b
xi =
n i=1 i
b
n i=1
n
! n
!
1 X 1 X
a x2 − x2 = x x2 − x
n i=1 i n i=1 i
b
n
!
X
x n1 x2i − x
i=1
a=
b n
X
2
x − 1
n
x2i
i=1
3
Por lo tanto,
a
bb = b −ba
x ! !
 n
X
 n
X
x
1
n
x2i − x   x n1 x2i − x 
1 
bb = ·  i=1
 
− i=1


n n
x  X
2
  X 
2
x −n 1
xi 2
x −n 1
x2i
   
i=1 i=1
n n
X x X
1
n
x2i − x − x2i + x2
i=1
n i=1
bb =
n
X
x2 − 1
n
x2i
i=1
Ası́, debemos hallar x para proceder a hallar los términos a y b. Sin embargo, se tiene que,
a
E(X) =
a+b
 n
X

1
x n x2i − x

i=1
n
X
1
x2 − n x2i
i=1
E(X) =  n  n n
X X xX 2
1
x n x2i − x 1
x2i −x− x + x2
n
n i=1 i

i=1 i=1
n
X + n
X
1
x2 − n x2i 2 1
x −n x2i
i=1 i=1
 n
X

1
x n x2i − x

i=1
n
X
1
x2 − n x2i
i=1
E(X) = n n n
X
2 2 1X 2 xX 2
x
xi − x + x −x− x + x2
n
i=1
n i=1 i n i=1 i
Xn
1
x2 − n x2i
i=1
n
!
X
x 1
n
x2i − x
i=1
E(X) = n
X
1
n
x2i − x
i=1
E(X) = x
4
20
1
X 0.777 + 0.760 + 0.769 + ... + 0.738 + 0.764 15.16
Luego, E(X) = x = 20
xi = = = 0.758 y
i=1
20 20
n
X (0.777)2 + (0.760)2 + ... + (0.764)2 0.604 + 0.578 + ... + 0.584 11.495
1
n
x2i = = = ≈ 0.575
i=1
20 20 20
Por lo tanto, se tiene un sistema de ecuaciones en dónde,
• Parámetro b:
a a
E(X) = −→ x = −→ 0.758 · (a + b) = a −→ 0.758 a + 0.758 b = a −→
a+b a+b
0.758 b = a − 0.758 a −→ 0.758 b = a (1 − 0.758) −→ 0.758 b = a · 0.242 −→
a · 0.242
b= −→ b = 0.3193 a
0.758
• Parámetro a:
ab a · (0.3193 a)
V ar(X) = −→ 0.000171 =
(a + b)2 (a
+ b + 1) (a + (0.3193 a))2 (a + 0.3193 a + 1)
0.3193 a2 0.3193 a2
0.000171 = −→ 0.000171 =
(1.3193 a)2 (1.3193 a + 1) 1.741 a2 (1.3193 a + 1)
0.3193 0.3193
0.000171 = −→ 0.000171 =
1.741(1.3193 a + 1) 2.296 a + 1.741
0.000171 · (2.296 a + 1.741) = 0.3193 −→ 0.000392 a + 1.741) = 0.3193

0.000392 a + 0.000298 = 0.3193 −→ 0.000392 a = 0.3193 − 0.000298
0.319
a= −→ a = 812.4987265
0.000392
• Parámetro b:
En consecuencia,
b = 0.3193 a −→ b = 0.3193 · 812.4987265 −→ b = 259, 4308434
Ası́, concluimos que a = 812.4987265 y b = 259, 4308434. Luego, para el desarrollo de este numeral,
haremos uso de los siguientes enunciados:
• La distribución empı́rica está dada por:

número de valores en la muestra ≤ x
S(X) =
n
• F ∗ (x) corresponde a la distribución beta con parámetros a = 812.4987265 y b = 259, 4308434.

Para facilidad en la realización del ejercicio, utilizaremos el programa Excel, en donde hare-
mos uso de la función "DISTR.BETA.N(x;alfa;beta;ACUMULADO;[A];[B]))", en donde "Alfa" y
"Beta" son los parámetros a y b. De la misma manera, como estamos hallando la función F ∗ (x), es
decir la función de distribución acumulada para una Beta, en la sección de "ACUMULADO" dentro de la
función, siempre será verdadera.
5
• Por el test de Kolmogorov - Smirnov, tenemos que el estadı́stico T , consiste en la distancia más grande
entre S(x) y F ∗ (x), en dónde el estadı́stico está dado por:
T = sup |F ∗ (x) − S(x)|

x
Las hipótesis a considerar son
H0 : F (x) = F ∗ (x) vs Ha : F (x) 6= F ∗ (x).
Se rechaza H0 al nivel de signicancia α si
T > wn,1−α
con wn,1−α dado por los cuantiles del test estadı́stico de Kolmogorov,
En la siguiente tabla se encuentran la distribución Empı́rica S(x), y la distribución Teórica F ∗ (x) =

Φ(x) correspondiente a cada valor de x de extracto de malta provenientes de maltas de cebada
Kindred.
x 73.8 73.9 74.2 74.3 74.6 74.7 75.4 76.0 76.1 76.4 76.5 76.6 76.9 77.3 77.4 77.5 77.7
S(x) 0,05 0,1 0,2 0,25 0,3 0,35 0,4 0,5 0,55 0,6 0,7 0,75 0,8 0,85 0,9 0,95 1
F ∗ (x) 0.065 0.075 0.112 0.127 0.179 0.199 0.376 0.557 0.587 0.674 0.701 0.728 0.799 0.875 0.891 0.905 0.929
|F ∗ (x) − S(x)| 0.0153 0.0248 0.0880 0.1232 0.1206 0.1503 0.0237 0.0567 0.0368 0.0739 0.0012 0.0224 0.0007 0.0255 0.0091 0.0450 0.0709
En la tabla anterior se observa que T = 0.1503. Como el ejercicio no nos proporciona un nivel de
significancia α, tomaremos un nivel de significancia igual a α = 0.05. Por lo tanto, siendo α = 0.05,
de la tabla de Kolmogorov se tiene que wn,1−α = w20,0.95 = 0.29408, luego T < w y se concluye que
no hay suficientes evidencias para considerar que la distribución muestral de los datos asociados a
los valores de extracto de malta provenientes de maltas de cebada Kindred, son realizaciones de una
distribución beta de parámetros a y b.
De la misma manera, podemos observar que sin importar el valor de significancia α que se tome,
esta conclusión será verdadera en cualquier caso debido a que el estadı́stico T nunca será mayor que
el valor de w.

Ejercicio 102 - Inferencia

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Ejercicio 102 - Inferencia

Cargado por

Copyright:

Formatos disponibles

Inferencia Estadı́stica

- Ejercicio 102 (Notas de Clase) -

Table 1: Porcentaje de base seca, ejemplo 102.

• La distribución empı́rica está dada por:

T = sup |F ∗ (x) − S(x)|

En la tabla anterior se observa que T = 0.156. Si α = 0.10, de la tabla de Kolmogorov se tiene

(ab)(a + b)2 + (a2 )(a + b)2 (a + b + 1)

Por lo tanto, se tiene un sistema de ecuaciones en dónde,

0.000171 · (2.296 a + 1.741) = 0.3193 −→ 0.000392 a + 1.741) = 0.3193

b = 0.3193 a −→ b = 0.3193 · 812.4987265 −→ b = 259, 4308434

• La distribución empı́rica está dada por:

• F ∗ (x) corresponde a la distribución beta con parámetros a = 812.4987265 y b = 259, 4308434.

T = sup |F ∗ (x) − S(x)|

Las hipótesis a considerar son

H0 : F (x) = F ∗ (x) vs Ha : F (x) 6= F ∗ (x).

Se rechaza H0 al nivel de signicancia α si

En la siguiente tabla se encuentran la distribución Empı́rica S(x), y la distribución Teórica F ∗ (x) =

También podría gustarte