Está en la página 1de 6

Inferencia Estadı́stica

- Ejercicio 102 (Notas de Clase) -


David Santiago Pérez Barrios
June 3, 2020

Ejercicio 102: En la siguiente tabla, se presentan los valores de extracto de malta provenientes de maltas
de cebada Kindred cultivada en 20 localidades en los viveros de cebada del un valle en un año particular,
expresados en porcentaje de base seca.

Table 1: Porcentaje de base seca, ejemplo 102.


77.7 76.0 76.9 74.6 74.7 76.5 74.2
75.4 76.0 73.9 77.4 76.6 77.3 74.3
77.5 74.2 76.1 76.5 73.8 76.4

1. Utilice el test de Kolmogorov-Smirnov para verificar si los datos se pueden asumir que son realiza-
ciones de una variable aleatoria X con distribución normal. Utilice α = 0.10. Presente la distribución
empı́rica y la distribución teórica en una tabla.
Para el desarrollo de este numeral, haremos uso de los siguientes enunciados:

• La distribución empı́rica está dada por:


número de valores en la muestra ≤ x
S(X) =
n
• F ∗ (x) corresponde a la distribución normal con media µ y varianza σ 2 . Para facilidad en la
realización del ejercicio, utilizaremos el programa Excel, en donde haremos uso de la función
"DISTR.NORM(x,µ,σ,ACUMULADO)", teniendo en cuenta los siguientes valores:
20
1
X 77.7 + 76.0 + 76.9 + ... + 73.8 + 76.4 1516
(a) µ = 20 xi = = = 75.8.
20 20
i=1
v
u 20
√ uX (xi − x)2 q q √
(b) σ = σ2 = t = 4+3.61+2.56+...+2.89+3.61
20 = 32.46
20 = 1.623 ≈ 1.274.
20
i=1
(c) Como estamos hallando la función F ∗ (x), es decir la función de distribución acumulada para la
normal, en la sección de "ACUMULADO" dentro de la función, siempre será verdadera.
• Por el test de Kolmogorov - Smirnov, tenemos que el estadı́stico T , consiste en la distancia más grande
entre S(x) y F ∗ (x), en dónde el estadı́stico está dado por:

T = sup |F ∗ (x) − S(x)|


x

1
Las hipótesis a considerar son
H0 : F (x) = F ∗ (x) vs Ha : F (x) 6= F ∗ (x).
Se rechaza H0 al nivel de signicancia α si
T > wn,1−α
con wn,1−α dado por los cuantiles del test estadı́stico de Kolmogorov,

En la siguiente tabla se encuentran el valor de z para cada variable, como la distribución Empı́rica
S(x), y la distribución Teórica F ∗ (x) = Φ(x) correspondiente a cada valor de x de extracto de malta
provenientes de maltas de cebada Kindred.

x 73.8 73.9 74.2 74.3 74.6 74.7 75.4 76.0 76.1 76.4 76.5 76.6 76.9 77.3 77.4 77.5 77.7
z = x−µσ
-1.570 -1.491 -1.256 -1.177 -0.942 -0.863 -0.314 0.157 0.235 0.471 0.549 0.628 0.863 1.177 1.256 1.334 1.491
S(x) 0,05 0,1 0,2 0,25 0,3 0,35 0,4 0,5 0,55 0,6 0,7 0,75 0,8 0,85 0,9 0,95 1
F ∗ (x) 0,058 0,068 0,105 0,120 0,173 0,194 0,377 0,562 0,593 0,681 0,709 0,735 0,806 0,880 0,895 0,909 0,932
|F ∗ (x) − S(x)| 0,008 0,032 0,095 0,130 0,127 0,156 0,023 0,062 0,043 0,081 0,009 0,015 0,006 0,030 0,005 0,041 0,068

En la tabla anterior se observa que T = 0.156. Si α = 0.10, de la tabla de Kolmogorov se tiene


que wn,1−α = w20,0.90 = 0.26473 por tanto T < w y se concluye que no hay suficientes evidencias
para considerar que la distribución muestral de los datos asociados a los valores de extracto de malta
provenientes de maltas de cebada Kindred, no son realizaciones de una distribución normal.
2. Teniendo en cuenta que el porcentaje toma valores entre 0 y 1, utilice el test de Kolmogorov-Smirnov
para verificar si los datos se pueden asumir que son realizaciones de una variable aleatoria X con
distribución beta. Si los parámetros de la distribución beta son a y b,
Γ(a + b) a−1
f (x; a, b) = x (1 − x)b−1
Γ(a)Γ(b)
a ab
con E(X) = a+b
y V ar(X) = (a+b)2 (a+b+1)
.

Para el desarrollo de este ejercicio, haremos uso del método de momentos para calcular el valor de
los parámetros a y b. Por hipótesis se tiene que:
a ab
E(X) = y V ar(X) =
a+b (a + b)2 (a + b + 1)
luego, teniendo en cuenta que V ar(X) = E(X 2 ) − [E(X)]2 , entonces
V ar(X) = E(X 2 ) − [E(X)]2
 2
ab 2 a
= E(X ) −
(a + b)2 (a + b + 1) a+b
2
ab a
+ = E(X 2 )
(a + b) (a + b + 1) (a + b)2
2

(ab)(a + b)2 + (a2 )(a + b)2 (a + b + 1)


= E(X 2 )
(a + b)4 (a + b + 1)
(ab) + (a2 )(a + b + 1)
2
= E(X 2 )
(a + b) (a + b + 1)
a3 + a2 + a2 b + ab
= E(X 2 )
(a + b)2 (a + b + 1)

2
Igualando el primer momento poblacional al primer momento muestral (x),

a a a
E(X) = x −→ = x −→ b a + bb) −→ a + bb −→ −b
b b b
a = x (b =b a = bb
a+b
b b x x
Luego, igualando el segundo momento poblacional al segundo momento muestral, se tiene que,
n
2 1X 2
E(X ) = x
n i=1 i
n
a3 + b
b a2 + b a2 b + b
abb 1X 2
= x
a + bb)2 (b
(b a + bb + 1) n i=1 i
n
a2 xba − b a xba − b
 
a3 + b
b a2 + b a +b a 1X 2
= x
n i=1 i
2 
a + xba − b a + xba − b
 
b a b a +1
3 2 n
ba3 + ba2 + bax − b a3 + bax − ba2 1X 2
= x
a 2 b n i=1 i
b
 a+x 
x x
a3 +ba2 n
b
x 1X 2
= x
a3 +b
b
x3
a2 x n i=1 i
n
x3 (b
a3 + b
a2 ) 1X 2
= x
a3 + b
x (b a2 x) n i=1 i
n
x2 · b
a2 · (b
a + 1) 1X 2
= x
a2 · (b
b a+ x) n i=1 i
n
x2 · (b
a + 1) 1X 2
= x
a+x
b n i=1 i
n
1X 2
x2 · (b
a + 1) = x · (b
a + x)
n i=1 i
n n
2 aX 2 x 2
bX
x2
b
a x +x = x +
n i=1 i n i=1 i
b
n n
2 aX 2 x 2
bX
x2i
b
a x +x =
b xi +
n i=1 n i=1
n n
aX 2 x bX
a x2 − x2 − x2
b
xi =
n i=1 i
b
n i=1
n
! n
!
1 X 1 X
a x2 − x2 = x x2 − x
n i=1 i n i=1 i
b

n
!
X
x n1 x2i − x
i=1
a=
b n
X
2
x − 1
n
x2i
i=1

3
Por lo tanto,
a
bb = b −ba
x ! !
 n
X
 n
X
x
1
n
x2i − x   x n1 x2i − x 
1 
bb = ·  i=1
 
− i=1


n n
x  X
2
  X 
2
x −n 1
xi 2
x −n 1
x2i
   
i=1 i=1
n n
X x X
1
n
x2i − x − x2i + x2
i=1
n i=1
bb =
n
X
x2 − 1
n
x2i
i=1

Ası́, debemos hallar x para proceder a hallar los términos a y b. Sin embargo, se tiene que,
a
E(X) =
a+b
 n
X

1
x n x2i − x

i=1
n
X
1
x2 − n x2i
i=1
E(X) =  n  n n
X X xX 2
1
x n x2i − x 1
x2i −x− x + x2
n
n i=1 i

i=1 i=1
n
X + n
X
1
x2 − n x2i 2 1
x −n x2i
i=1 i=1
 n
X

1
x n x2i − x

i=1
n
X
1
x2 − n x2i
i=1
E(X) = n n n
X
2 2 1X 2 xX 2
x
xi − x + x −x− x + x2
n
i=1
n i=1 i n i=1 i
Xn
1
x2 − n x2i
i=1
n
!
X
x 1
n
x2i − x
i=1
E(X) = n
X
1
n
x2i − x
i=1
E(X) = x

4
20
1
X 0.777 + 0.760 + 0.769 + ... + 0.738 + 0.764 15.16
Luego, E(X) = x = 20
xi = = = 0.758 y
i=1
20 20
n
X (0.777)2 + (0.760)2 + ... + (0.764)2 0.604 + 0.578 + ... + 0.584 11.495
1
n
x2i = = = ≈ 0.575
i=1
20 20 20

Por lo tanto, se tiene un sistema de ecuaciones en dónde,

• Parámetro b:
a a
E(X) = −→ x = −→ 0.758 · (a + b) = a −→ 0.758 a + 0.758 b = a −→
a+b a+b
0.758 b = a − 0.758 a −→ 0.758 b = a (1 − 0.758) −→ 0.758 b = a · 0.242 −→
a · 0.242
b= −→ b = 0.3193 a
0.758
• Parámetro a:
ab a · (0.3193 a)
V ar(X) = −→ 0.000171 =
(a + b)2 (a
+ b + 1) (a + (0.3193 a))2 (a + 0.3193 a + 1)
0.3193 a2 0.3193 a2
0.000171 = −→ 0.000171 =
(1.3193 a)2 (1.3193 a + 1) 1.741 a2 (1.3193 a + 1)
0.3193 0.3193
0.000171 = −→ 0.000171 =
1.741(1.3193 a + 1) 2.296 a + 1.741

0.000171 · (2.296 a + 1.741) = 0.3193 −→ 0.000392 a + 1.741) = 0.3193


0.000392 a + 0.000298 = 0.3193 −→ 0.000392 a = 0.3193 − 0.000298
0.319
a= −→ a = 812.4987265
0.000392
• Parámetro b:
En consecuencia,

b = 0.3193 a −→ b = 0.3193 · 812.4987265 −→ b = 259, 4308434

Ası́, concluimos que a = 812.4987265 y b = 259, 4308434. Luego, para el desarrollo de este numeral,
haremos uso de los siguientes enunciados:

• La distribución empı́rica está dada por:


número de valores en la muestra ≤ x
S(X) =
n

• F ∗ (x) corresponde a la distribución beta con parámetros a = 812.4987265 y b = 259, 4308434.


Para facilidad en la realización del ejercicio, utilizaremos el programa Excel, en donde hare-
mos uso de la función "DISTR.BETA.N(x;alfa;beta;ACUMULADO;[A];[B]))", en donde "Alfa" y
"Beta" son los parámetros a y b. De la misma manera, como estamos hallando la función F ∗ (x), es
decir la función de distribución acumulada para una Beta, en la sección de "ACUMULADO" dentro de la
función, siempre será verdadera.

5
• Por el test de Kolmogorov - Smirnov, tenemos que el estadı́stico T , consiste en la distancia más grande
entre S(x) y F ∗ (x), en dónde el estadı́stico está dado por:

T = sup |F ∗ (x) − S(x)|


x

Las hipótesis a considerar son

H0 : F (x) = F ∗ (x) vs Ha : F (x) 6= F ∗ (x).

Se rechaza H0 al nivel de signicancia α si

T > wn,1−α

con wn,1−α dado por los cuantiles del test estadı́stico de Kolmogorov,

En la siguiente tabla se encuentran la distribución Empı́rica S(x), y la distribución Teórica F ∗ (x) =


Φ(x) correspondiente a cada valor de x de extracto de malta provenientes de maltas de cebada
Kindred.

x 73.8 73.9 74.2 74.3 74.6 74.7 75.4 76.0 76.1 76.4 76.5 76.6 76.9 77.3 77.4 77.5 77.7
S(x) 0,05 0,1 0,2 0,25 0,3 0,35 0,4 0,5 0,55 0,6 0,7 0,75 0,8 0,85 0,9 0,95 1
F ∗ (x) 0.065 0.075 0.112 0.127 0.179 0.199 0.376 0.557 0.587 0.674 0.701 0.728 0.799 0.875 0.891 0.905 0.929
|F ∗ (x) − S(x)| 0.0153 0.0248 0.0880 0.1232 0.1206 0.1503 0.0237 0.0567 0.0368 0.0739 0.0012 0.0224 0.0007 0.0255 0.0091 0.0450 0.0709

En la tabla anterior se observa que T = 0.1503. Como el ejercicio no nos proporciona un nivel de
significancia α, tomaremos un nivel de significancia igual a α = 0.05. Por lo tanto, siendo α = 0.05,
de la tabla de Kolmogorov se tiene que wn,1−α = w20,0.95 = 0.29408, luego T < w y se concluye que
no hay suficientes evidencias para considerar que la distribución muestral de los datos asociados a
los valores de extracto de malta provenientes de maltas de cebada Kindred, son realizaciones de una
distribución beta de parámetros a y b.
De la misma manera, podemos observar que sin importar el valor de significancia α que se tome,
esta conclusión será verdadera en cualquier caso debido a que el estadı́stico T nunca será mayor que
el valor de w.

También podría gustarte