Está en la página 1de 14

Trabajo de Diseño de Experimentos

Distribuciones muestrales y Prueba de hipótesis

Presentado por:
Jaime Pineda
Emerson Sierra
Mateo Díaz

Presentado a: Ing. Ader Villar

Universidad Pontificia Bolivariana – Seccional Montería

2018
 xi  x 
n 2

s 
2

i 1 n 1

a. Muestre que S2 es un estimador insesgado de la varianza σ 2.

Realizando la suma y resta de la media muestral X́ es fácil ver que:


n n

 Xi       xi  x    x    
2 2

i 1 i 1
n n n

  xi  x     x     2  x      xi  x 
2 2

i 8 i 1 i 1
n

 X  X   n X  
2 2
i
i 1
n

 x  X 
2
2

y sustituir  n  1 s por
σ 2 i
Al dividir cada término de la igualdad por i 1

 n  1 s 2   x   
2
1 n
 i 
2
x   
 2 i 1 2 2 ƒ n
1 n
2  i
x  
2

Sabemos que  i 1 es una variable aleatoria chi-cuadrado con n grados de


 x  
2

libertad, también que  ƒ n es una variable aleatoria chi-cuadrado con 1 grado de


2

 n  1 s 2
libertad y que 
2
es una variable aleatoria con n-1 grados de libertad.
Ahora sabiendo que
n n

 x  x     xi     n  x   
2 2 2
i
i 1 i 1

Entonces:
 1 n 2
E  s2   E    xi  x  
 n  1 i 1 

1  n 2 1 n

     
2
E xi    nE x      x2i  n x2
= n  1  i 1 = n  1 i 1

Sin embargo:

2
i=1,2 … , n  
2
 
2 2
n
x
xi
Para y
Por lo tanto:
1  2 2 
E  s2    n  n  
2

n 1  n 
 n  1 s 2
b. Use los resultados 1 a 4 dados en clase para mostrar que el estadístico 2
tiene una distribución chi-cuadrado con n-1 grados de libertad.

Sabemos que:
 xi  x 
n 2

s 
2

i 1 n 1
Entonces:

 xi  x 
2

 n  1  i 1
n

 n  1 s 2
n 1
2 = 2

Según el resultado 3

x ~ N  0,1
z  x 2  x   xi  x 
Entonces z   xi  x  con z ~ x1
2 2 2

Ahora, según el resultado 4:


zi ~ x12
z  z i
z ~ xn2
 n  1 s 2 ~ xn21 μ
Entonces tenemos que 2porque al estimar es decir, cuando se
reemplaza μ con X́ , se pierde un grado de libertad. En otras palabras en la muestra
aleatoria de la distribución hay n grados de libertad o n partes de información
independientes. Cuando los datos se utilizan para calcular la media, hay un grado
menos de libertad en la información que se usa para estimar σ 2.

c. Use el resultado 6, dado en clase junto, con el resultado del inciso anterior para
x 
T
mostrar que el estadístico s ƒ n tiene una distribución t de student con n-1
grados de libertad.

Según el resultado 6:

z
T
V
v

Ahora sabemos que:


x 
z
ƒ n

V
 n  1 s 2
2
v  n 1
z ~ N  0,1
y V ~ X v  v  n 1
2
Donde
Entonces:

x 
ƒ n
z
T
V
 n  1 s 2 ƒ n 1
v => 2

Cancelando términos, quedaría:


x 
ƒ n
σ =¿ x  u n
s  
=  , aplicando ley de la oreja y cancelando s

Por ultimo:

T
 x  
sƒ n

Ahora demostraremos que T ~ tn 1 con la función de densidad de la distribución t .


 v 1 ƒ 2
  v  1 ƒ 2   t 2 
h t  1   ,   t  
 
 v
2
v  v

Ahora sean X 1 , X 2 , … , X nvariables aleatorias independientes normales con media μ


y desviación estándarσ . Sea:

1 n 1 n
   xi  x 
2
x xi s 2

n i 1 Y n  1 i 1

T
 x  
t v=n−1
Entonces la variable aleatoria sƒ n tiene una distribución con
grados de libertad.
3
a) 1) H 0=π μ1−e μ 2+ 2 μ 3= log 2
H a=¬ H 0

¿
2) θ =π x 1−e x2 +3 /2 x 3
¿
E(θ )=π (x1 )−e ( x 2)+3 /2( x3 )

¿ ϑ21 ϑ22 ϑ 23
var (θ )= + +
n1 n2 n3
3)
π x 1−e x 2 +3 /2 x 3−(−log 2)
Z cal= 2 2 2
N ¿)
√(ϑ )/n +(ϑ )/n +(ϑ )/n
1 1 2 2 3 3

b)
3
1) H 0=π μ1−e μ 2+ 2 μ 3= log 2
H a=¬ H 0

¿
2) θ =π x 1−e x2 +3 /2 x 3
¿
E(θ )=π (x1 )−e (x 2)+3 /2( x3 )

Como las ϑ son iguales


ϑ21 ϑ22 ϑ 23 2 1 1 1
¿
var (θ )= + + = ϑ ( + + )
n1 n2 n3 n1 n 2 n3
Estimar ϑ2

( n1−1 ) s21 + ( n 2−1 ) s 22+ ( n3−1 ) s23


MSE=
n1 +n2 +n3 −3

1 1 1
var (θ)=MSE ( + + )
n 1 n2 n3

π ¯ x 1−e ¯ x 2 +3/2 ¯ x 3−(−log2)


T cal= t ∞
√ MSE∗(1/n1 +1/n2 +1/n3 ) (n +n + n −3 )
1
22 3

C)
μ1 + μ2 + μ2 ⇒ desconocidas
ϑ21 +ϑ22 +ϑ23 ⇒conocidas
Hipótesis.
K
H 0 : ∑ . ci μi=c0
i=1
K
H a : ∑ . c i μi >c 0
i=1
¿ K
θ =∑ . c i x i
i=1
k
ϑ2
var (θ)=∑ .
i=1 ni
k
( ni−1 ) s2i
MSE=∑ .
i=1 ni −k
¿ ¿
1 1
var (θ )=MSE ( +...+ )
n1 nk
k

∑ ❑ c i x i−c0
i=1
T cal= K

√∑
i=1
❑(( ni−1) s2i )/(ni −k )∗(1/n1 +...+1/nk )

  20000
n  100
  0, 05
  3900

Hipótesis

H 0 :   20000
H a :   20000

Estimador y estadístico

  E    | H0 ˆ  x
Tcal=¿
var   
E x  

23500  20000
Tcal=¿
3900 / 100 =8,97

Región de rechazo.

Tcrit (0.05,99) =¿2,66


Valor p=¿ 4,82038E-14

Conclusión
Como Tcal=8,97>Tcrit=2,66, entonces se rechaza H 0. Con un nivel de significancia de
0,05>p-valor=4,82038E-14, la media que recorren los accidentes por año es menor que
20000.

Población Mujeres No Fumadoras (Población 1)


X́ 1 =0,9158

δ 21=0.045
n1 =24
Población Mujeres Fumadoras (Población 2)
X́ 2 =0,9762

δ 22=0.1532
n2 =8

1. Hipótesis

H o : μ2−μ1=0
H a : μ2−μ1 ≠ 0

2. Estimador y estadístico
θ estimado= X́ 2− X́ 1
E ( θ estimado )=μ2 −μ1
σ 22 σ 21
Var ( θ estimado )= +
n 2 n1
Como σ 22 y σ 21 son iguales entonces
Var ( θ estimado )=σ 2 ( n1 + n1 )
2 1

Para estimar σ calculamos MSE


2

( n1−1 ) δ 21+ ( n2−1 ) δ 22


MSE=
n1 +n2−2

Ahora como ya se estimo σ 2


1 1
Var . Estimada ( θ estimado )=MSE ( +
n 2 n1 )
θ estimado−E ( θ estimado ) / H o
T cal=
√Var . Estimada (θ estimado )

X́ 2− X́ 1−( μ 2−μ1)
T cal=
1 1
√ MSE
( +
n 2 n1 )
( 24−1 ) 0,045+ ( 8−1 ) 0,1532
MSE=
24+ 8−2
( 23 ) 0,045+ (7 ) 0,1532
MSE= =0,070
30

0,9762−0,9158−0
T cal= =0,55
1 1
√ (
0,070 +
8 24 )
3. Región de rechazo

T crítico con 30 grados de libertad y ∝/2=0,025


TCritico =2.0425 [Tabla distribución t student]
Mediante Excel se calcula el valor p con la formula =DISTR.F.CD(0.55;1;30)
valor p=0,4640

4. Conclusión
Como p – valor = 0,4640 > ∝=0,05 No rechazo H o con un nivel de significancia de 5% no
hay una diferencia entre los niveles de ácido ascórbico en plasma de mujeres fumadoras y
no fumadoras
a. La cantidad promedio de nieve que cae en el lago George durante el mes de febrero es
de 21.8 centímetros.

Población: Conjunto de lagos


Variable: Cantidad de nieve que cae en el lago George medida en centímetros

HIPOTESIS
H 0 :μ=21.8
H a : μ≠ 21.8

b. En promedio, los niños asisten a la escuela en un área de 6.2 kilómetros de sus casas
en un suburbio de St. Louis.

Población: Todos los suburbios de St. Louis


Variable: Cantidad de kilómetros recorridos por un niño desde su casa a la escuela

HIPOTESIS
H 0 :μ=6.2 km
H a : μ>¿6.2 km
c. En promedio, las amas de casa estadounidenses beben 3 tazas de café al día.

Población: Amas de casa


Variable: Cantidad de tasas de café al día
HIPOTESIS
H 0 :μ=3
H a : μ≠ 3

d. El donativo promedio a la American Lung Association no es mayor de 10 dólares.

Población: Donaciones hechas a la Amaerican Lung Association


Variable: Cantidad de donativo en dólares

HIPOTESIS
H 0 :μ=10
H a : μ>10
e. Los residentes de la zona suburbana de Richmond viajan en promedio 15 kilómetros
para llegar a su lugar de trabajo.

Población: Zonas suburbanas


Variable: Cantidad de kilómetros a viajar

HIPOTESIS
H 0 :μ=15
H a : μ≠ 15

También podría gustarte