Está en la página 1de 15

TRABAJO II

INFERENCIA MULTIVARIADA

DANIEL ESTEBAN LLORENTE ESPITIA


OVER JOSÉ LÓPEZ MUÑOZ
JOSÉ LUIS DUARTE PASTRANA
ANDREA DE LA ROSA
ANDERSON DÍAZ CABRALES

MARIO ALFONSO MORALES RIVERA

UNIVERSIDAD DE CÓRDOBA
FALCULTAD DE CIENCIAS BÁSICAS
ESTADÍSTICA
MONTERÍA
2019

1
2. Considere los datos

 
2 8 6 8
X=
12 9 9 10

y la hipótesis H0 : µ0 = (7, 11)

(a) Verifique la hipótesis anterior para cada una de las medias en forma sep-
arada. Escriba los supuestos estadı́sticos requeridos, use α = 0.05.

(b) Verifique la hipótesis conjunta, use α = 0.05.

Solución

(a) La hipótesis individuales a probar son

H01 : µ1 = 7 vs H11 : µ1 6= 7

H02 : µ2 = 11 vs H12 : µ2 6= 11

El estadı́stico de prueba para probar estas hipótesis es

xi −µ0i
zi = √
σi / n
con i = 1, 2.

se rechaza H0i si |Zi | > Zα/2

La media, desviación estándar y tamaño de muestra para x1 y x2 son

x1 = 6, σ1 = 2.8284, n1 = 4
x2 = 10, σ2 = 1.4142, n2 = 4

Ası́ los estadı́sticos de prueba para x1 y x2 son

6−7 √ 10−11√
z1 = 2.8284/ 4
= −0.7071 y z2 = 1.4142/ 4
= −1.4142

2
Las conclusiones serán resumidas en la siguiente tabla

i |Z| Z0.025 Conclusión


1 0.7071 1.96 No se rechaza H01
2 1.4142 1.96 No se rechaza H02

Como la hipótesis H0i no se re rechazó, se concluye con α = 0.05 que µ1 = 7 y


µ2 = 11.

(b) La hipótesis a probar es la siguiente:

   
7 7
H0 : µ = vs H1 : µ 6=
11 11

Como Σ es desconocida, entonces el estadı́stico de prueba viene dado por

0
T 2 = n(X − µ0 ) S −1 (X − µ0 ) ∼ T(p,n−1)
2

se rechaza H0 si T 2 ≥ T(α,p,n−1)
2

Calculemos es estadı́stico de prueba, para ello necesitamos el vector de medias


y la matriz de covarianzas y varianzas de X.

   
6 8 −3.3333
X= y S=
10 −3.3333 2

El número de individuos es n = 4 con p = 2 variables a estudiar.

Ası́
   0  −1    
2 6 7 8 −3.3333 6 7
T =4 − −
10 11 −3.3333 2 10 11
  
0.4091 0.6818 −1
= 4(−1, −1)
0.6818 1.6364 −1
 
−1
= 4(−1.0909, −2.3182)
−1

= 4(3.4091)

= 13.6364

3
Ahora buscamos en la tabla de los percentiles de la distribución T 2 de
2
Hotelling, T(0.05,2,3) = 57.

Como T 2 = 13.6364 < T(0.05,2,3)


2
= 57 no se rechaza H0 , lo cual nos lleva a
 
7
concluir con α = 0.05 que µ = .
11

Obs: Notamos que en el caso univariado no se rechazaron las hipótesis nulas,


lo mismo sucedió cuando se probó la hipótesis conjunta.

6. Considere los datos de la tabla 3.8.

(a) Pruebe la hipótesis de que las respuestas medias en todos los periodos son
iguales.
(b) Suponga que los tres primeros individuos en este conjunto de datos fueran
controles (reciben un placebo) y a los cinco últimos se les aplica el mismo
tratamiento. Pruebe que estos dos grupos tienen medias iguales, suponiendo
que tienen matrices iguales de covarianzas.
(c) Con el mismo supuesto del inciso 6b, pruebe si los dos grupos tienen
perfiles paralelos.
(d) Muestre una representación gráfica de los perfiles para estos dos grupos.

Solución

(a) La hipótesis de interés es:

H0 : µ1 = µ2 = µ3 = µ4 = µ5

la cual puede escribirse como:

H0 : Cµ = 0

donde

 
1 −1 0 0 0
1 0 −1 0 0
C= 
1 0 0 −1 0
1 0 0 0 −1

4
Para probar H0 : Cµ = 0, se deben transformar los datos mediante Y = CX.
De esta manera, el vector de medias muestral para Y es Y = CX y su matriz
de covarianzas SY = CSX C 0 .

La estadı́stica para verificar esta hipótesis esta dada por

T 2 = n(Y )0 SY−1 (Y ) = n(CX)0 (CSX C 0 )−1 (CX)

Se rechaza H0 si, T 2 ≥ T(α,p−1,n−1)


2

Ası́, el vector de medias y la matriz de covarianzas muestral son,


respectivamente,

0
X = (23.500, 24.625, 22.625, 19.500, 18.125)

 
48.000000 17.357143 30.07143 9.285714 5.50000
17.357143 11.410714 15.12500 7.214286 14.33929
 
30.071429 15.125000 38.26786 15.785714 16.91071
S= 
 9.285714 7.214286 15.78571 10.571429 16.35714
5.500000 14.339286 16.91071 16.357143 38.69643

Las expresiones (CX) y CSX C 0 , calculadas de acuerdo con los datos


disponibles, son respectivamente

(CX)0 = (−1.125, 0.875, 4.000, 5.375)

 
24.69643 15.69643 28.57143 39.48214
15.69643 26.12500 24.42857 29.33929
CSX C 0 = 
28.57143 24.42857 40.00000 49.57143.

39.48214 29.33929 49.57143 75.69643

La estadı́stica T 2 toma el valor

T 2 = n(CX)0 (CSX C 0 )−1 (CX)  


−1.125
 0.875 
= (8)(-1.125,0.875,4.000,5.375)(CSX C 0 )−1  
 4.000 
5.375
= (8)(6.963177)

= 55.70542

5
2
El valor para T(0.05,4,7) = 44.718 el cual es menor que el valor del estadı́stico
2
T = 55.70542 , de manera que estos datos provocan el rechazo de la hipótesis
nula. Esto nos lleva a concluir con α = 0.05 que al menos una repuesta media
de los tiempos posteriores al tratamiento es diferente.

(b) La hipotesis de interes es

H0 : µ1 = µ2

Aquı́ n1 = 3, n2 = 5 y p = 5, luego v = n1 + n2 − 2 = 6.

Los respectivos vectores de medias y matrices de covarianzas son


   
21.33333 122.333 45.833 85.333 14.166 2.333
 24.333   45.833 30.33 43.333 13.167 28.333
   
 24.333 
X1 =   85.333 43.333 69.333
S1 =  16.667 25.333


 20.666   14.167 13.167 16.667 6.333 16.667
20.333 2.333 28.333 25.333 16.667 57.333
   
24.8 17.2 6.70 14.4 12.20 14.2
24.8  6.7 4.70 5.4 6.45 11.7
   
21.6
X2 =  14.4 5.40 28.8 16.90
S2 =  12.4


18.8 12.2 6.45 16.9 13.70 17.2
16.8 14.2 11.70 12.4 17.20 33.2

Se asume que las matrices de covarianzas muestrales no reflejan una diferencia


notoria con relación a las respectivas matrices de covarianzas poblacionales.
La matriz de covarianzas muestral ponderada es
 
52.244 19.744 38.044 12.856 10.244
19.744 13.244 18.044 8.689 17.244
(3−1)S1 +(5−1)S2
 
Sp = 38.044 18.044 42.311 16.822 16.711
= 
3+5−2
12.856 8.689 16.822 11.244 17.022
10.244 17.244 16.711 17.022 41.244

La estadı́stica de prueba es

T 2 = ( nn11+n
n2
2
)(X1 − X2 )0 Sp−1 (X1 − X2 ) = 47.92661

entonces, por la transformación a la estadı́stica F y como


F(0.05,5,2) = 19.29641, se tiene que

6
vp (6)(5)
T2 < (v−p+1) F(0.05,p,v−p+1) ≈ 6−5+1 (19.29641) = 289.4461

y por tanto no se rechaza H0 . Es decir que no hay diferencias significativas


entre el grupo que recibe el placebo y el otro grupo que se le aplica el
tratamiento.

(c) La hipótesis de interés es

H01 : µ1i − µ1,i−1 = µ2i − µ2,i−1 , para i = 2, 3, 4, 5

La cual puede escribirse como H01 : Cµ1 = Cµ2 , donde la matriz de constantes
es
 
1 −1 0 0 0
0 1 −1 0 0
C= 
0 0 1 −1 0
0 0 0 1 −1

La estadı́stica T 2 toma la forma

T 2 = ( nn11+n
n2
2
)(CX 1 − CX 2 )0 [CSp C 0 ]−1 (CX 1 − CX 2 )

= ( 15
8 )(2.417804)

= 4.533382

Puesto que T 2 = 4.533382 < T0.05,4,6


2
= 72.937, no se rechaza H01 lo cual
indica que los dos grupos tienen perfiles paralelos.

(d) Representación gráfica de los perfiles para estos dos grupos

7
10. Los datos de la tabla 3.12 muestra los resultados de una prueba estándar
de tolerancia de glucosa administrada a 8 controles y a 10 pacientes obesos.
Los datos (medidas del plasma de fosfato inorgánico), se determinaron a partir
de muestras de sangre tomadas a 0, 0.5, 1, 1.5 y 2 horas después de una dosis
estándar de glucosa suministrada oralmente.

(a) Pruebe la hipótesis de que los contenidos medios de glucosa en la sangre de


los obesos es igual en todos los perı́odos.
(b) Pruebe que los controles y los obesos tienen igual contenido medio de
glucosa en cada momento, contra la alternativa que las medias son distintas,
suponiendo que tienen matrices iguales de covarianzas.
(c) Pruebe si el perfil de obesos es paralelo al perfil de los controles.
(d) Muestre una representación gráfica de los perfiles para estos dos grupos.

Solución

(a) La hipótesis de interés es:

H0 : µ1 = µ2 = µ3 = µ4 = µ5

las cual se puede escribir como:

H0 : Cµ = 0

donde

 
1 −1 0 0 0
1 0 −1 0 0
C= 
1 0 0 −1 0
1 0 0 0 −1

La estadı́stica para verificar esta hipótesis esta dada por

T 2 = n(Y )0 SY−1 (Y ) = n(CX)0 (CSX C 0 )−1 (CX)

Se rechaza H0 si, T 2 ≥ T(α,p−1,n−1)


2

8
Ası́, el vector de medias y la matriz de covarianzas muestral son,
respectivamente,

0
X = (4.31, 3.99, 3.39, 3.15, 2.90)

 
0.6543333 0.6878889 0.3301111 0.4350000 0.2466667
0.6878889 0.8698889 0.3910000 0.4761111 0.3344444
 
0.3301111
S= 0.3910000 0.3565556 0.3516667 0.3277778

0.4350000 0.4761111 0.3516667 0.4250000 0.3255556
0.2466667 0.3344444 0.3277778 0.3255556 0.4088889

Las expresiones (CX) y CSX C 0 , calculadas de acuerdo con los datos


disponibles, son respectivamente

(CX)0 = (0.32, 0.92, 1.16, 1.41)

 
0.148444444 0.02733333 0.007555556 0.05422222
0.027333333 0.35066667 0.240888889 0.40533333
CSX C 0 = 
0.007555556 0.24088889 0.209333333 0.29822222.

0.054222222 0.40533333 0.298222222 0.56988889

La estadı́stica T 2 toma el valor

T 2 = n(CX)0 (CSX C 0 )−1 (CX)  


0.32
0.92
= (10)(0.32,0.92,1.16,1.41)(CSX C 0 )−1 
1.16

1.41
= (10)(9.809062)

= 98.09062

2
El valor para T(0.05,4,9) = 27.20206 el cual es menor que el valor del estadı́stico
2
T = 98.09062 , de manera que estos datos provocan el rechazo de la hipótesis
nula. Lo cual nos lleva a concluir con α = 0.05 que por lo menos en un periodo
del contenido medio de glucosa en la sangre de los obesos es diferente.

9
(b) La hipotesis de interes es

H0 : µ1 = µ2

Aquı́ n1 = 10, n2 = 8 y p = 5, luego v = n1 + n2 − 2 = 16.

Los respectivos vectores de medias y matrices de covarianzas son


   
4.31 0.6543333 0.6878889 0.3301111 0.4350000 0.2466667
3.99 0.6878889 0.8698889 0.3910000 0.4761111 0.3344444
   
X 1 = 3.39 S1 = 
 
0.3301111 0.3910000 0.3565556 0.3516667 0.3277778

3.15 0.4350000 0.4761111 0.3516667 0.4250000 0.3255556
2.90 0.2466667 0.3344444 0.3277778 0.3255556 0.4088889
   
3.9625 0.0826785 0.1258928 0.063928 −0.0067857 −0.0017857
3.2375
 
 0.1258928
 0.4426785 0.153214 0.0082142 −0.0239285
X 2 = 2.5250 S2 =  0.0639285
   0.1532142 0.173571 −0.0835714 −0.1335714 
2.4750 −0.0067857 0.0082142 −0.083571 0.1307142 0.0192857 
3.1250 −0.0017857 −0.0239285 −0.133571 0.0192857 0.2735714

Se asume que las matrices de covarianzas muestrales no reflejan una diferencia


notoria con relación a las respectivas matrices de covarianzas poblacionales.
La matriz de covarianzas muestral ponderada es
 
0.4042344 0.4420156 0.2136563 0.2417187 0.1379688
0.4420156 0.6829844 0.2869687 0.2714063 0.1776563
(10−1)S1 +(8−1)S2
 
Sp = 10+8−2 0.2136563
= 0.2869687 0.2765000 0.1612500 0.1259375
0.2417187 0.2714063 0.1612500 0.2962500 0.1915625
0.1379688 0.1776563 0.1259375 0.1915625 0.3496875

La estadı́stica de prueba es

T 2 = ( nn11+n
n2
2
)(X 1 − X 1 )0 Sp−1 (X 1 − X 2 ) = 30.80639

entonces, por la transformación a la estadı́stica F y como


F(0.05,5,12) = 3.105875, se tiene que

vp (16)(5)
T2 > (v−p+1) F(0.05,p,v−p+1) ≈ 16−5+1 (3.105875) = 20.70583

y por tanto se rechaza H0 . Es decir que el grupo de controles difiere


significativamente del grupo de obesos.

10
(c) La hipótesis de interés es

H01 : µ1i − µ1,i−1 = µ2i − µ2,i−1 , para i = 2, 3, 4, 5

La cual puede escribirse como H01 : Cµ1 = Cµ2 , donde la matriz de constantes
es

 
1 −1 0 0 0
0 1 −1 0 0
C= 
0 0 1 −1 0
0 0 0 1 −1

La estadı́stica T 2 toma la forma

T 2 = ( nn11+n
n2
2
)(CX 1 − CX 2 )0 [CSp C 0 ]−1 (CX 1 − CX 2 )

= ( 80
18 )(6.045675)

= 26.86967

Puesto que T 2 = 26.86967 > T0.05,4,16


2
= 15.65104, se rechaza H01 lo cual
indica que el perfil de obesos no es paralelo al perfil de los controles.

(d) Representación gráfica de los perfiles para el grupo de obesos y el grupo de


control

11
11. Se tomaron medidas dentales a 11 niñas y 16 niños a las edades de 8, 10,
12, y 14 años. Cada medida es la distancia en milı́metros del centro de la
pituitaria a la fisura pteromaxilar, el objetivo del estudio de estos datos es
investigar el patrón de crecimiento de casos dentales para los grupos de niños y
niñas separadamente y estudiar si no hay diferencias significativas entre los dos
grupos 4. Los datos se muestran en la tabla 3.13

(a)Pruebe la hipótesis de que las distancias dentales medias de los niños en


todas las edades son iguales.
(b) Pruebe que los niños y las niñas tienen distancias medias iguales en todos
los perı́odos, contra la alternativa que las medias son distintas, suponiendo
poblaciones con matrices de covarianzas iguales.
(c)Pruebe si el perfil de niñas es paralelo al perfil de niños.
(d)Muestre una representacı́on gráfica de los perfiles para estos dos grupos.

Solución

(a) La hipótesis de interés es:

H0 : µ1 = µ2 = µ3 = µ4

las cuales pueden escribirse como:

H0 : Cµ = 0

donde

 
1 −1 0 0
C = 1 0 −1 0
1 0 0 −1

La estadı́stica para verificar esta hipótesis esta dada por

T 2 = n(Y )0 SY−1 (Y ) = n(CX)0 (CSX C 0 )−1 (CX)

Se rechaza H0 si, T 2 ≥ T(α,p−1,n−1)


2

12
Ası́, el vector de medias y la matriz de covarianzas muestral son,
respectivamente,

0
X = (22.8750, 23.8125, 25.7187, 27.4687)

 
6.016667 2.291667 3.629167 1.612500
2.291667 4.562500 2.193750 2.810417
S=
3.629167 2.193750 7.032292 3.240625

1.612500 2.810417 3.240625 4.348958

Las expresiones CX y CSX C 0 , calculadas de acuerdo con los datos


disponibles, son respectivamente

(CX)0 = (−0.93750, −2.84375, −4.59375)

 
5.995833 2.289583 4.922917
CSX C 0 = 2.289583 5.790625 4.015625.
4.922917 4.015625 7.140625

La estadı́stica T 2 toma el valor

T 2 = n(CX)0 (CSX C 0 )−1 (CX)  


−0.93750
= (16)(-0.93750,-2.84375,-4.59375)(CSX C 0 )−1 −2.84375
−4.59375
= (16)(4.872309)

= 77.95695

2
El valor para T(0.05,3,15) = 11.80569 el cual es menor que el valor del
2
estadı́stico T = 77.95695 , de manera que estos datos provocan el rechazo de
la hipótesis nula. Lo cual nos lleva a concluir con α = 0.05 que al menos en
una de las edades las distancias dentales medias de los niños es diferente.

13
(b) La hipotesis de interes es

H0 : µ1 = µ2

Aquı́ n1 = 16, n2 = 11 y p = 4, luego v = n1 + n2 − 2 = 25.

Los respectivos vectores de medias y matrices de covarianzas son


   
22.8750 6.016667 2.291667 3.629167 1.612500
23.8125 2.291667 4.562500 2.193750 2.810417
X1 = 
25.7187
 S1 = 
3.629167

2.193750 7.032292 3.240625
27.4687 1.612500 2.810417 3.240625 4.348958
   
21.1818 4.513636 3.354545 4.331818 4.356818
22.2272 3.354545 3.618182 4.027273 4.077273
X2 = 
23.0909
 S2 = 
4.331818

4.027273 5.590909 5.465909
24.0909 4.356818 4.077273 5.465909 5.940909

Se asume que las matrices de covarianzas muestrales no reflejan una diferencia


notoria con relación a las respectivas matrices de covarianzas poblacionales.
La matriz de covarianzas muestral ponderada es
 
5.415455 2.716818 3.910227 2.710227
(16−1)S1 +(11−1)S2
2.716818 4.184773 2.927159 3.317159
Sp = 16+11−2 =
3.910227 2.927159 6.455739 4.130739

2.710227 3.317159 4.130739 4.985739

La estadı́stica de prueba es

n1n2
T 2 = ( n1+n2 )(X1 − X2 )0 Sp−1 (X1 − X2 ) = 16.50751

entonces, por la transformación a la estadı́stica F y como


F(0.05,4,22) = 2.816708, se tiene que

vp (25)(4)
T2 > (v−p+1) F(0.05,p,v−p+1) ≈ 25−4+1 (2.816708) = 12.80322

y por tanto se rechaza H0 . Es decir que los niños y las niñas no tienen
distancias medias iguales en todos los periodos.

14
(c) La hipótesis de interés es

H01 : µ1i − µ1,i−1 = µ2i − µ2,i−1 , para i = 2, 3, 4

La cual puede escribirse como H01 : Cµ1 = Cµ2 , donde la matriz de constantes
es

 
1 −1 0 0
C = 0 1 −1 0 
0 0 1 −1

La estadı́stica T 2 toma la forma

T 2 = ( nn11+n
n2
2
)(CX 1 − CX 2 )0 [CSp C 0 ]−1 (CX 1 − CX 2 )

= ( 176
27 )(1.348301)

= 8.788925

Puesto que T 2 = 8.788925 < T0.05,3,25


2
= 9.873908, no se rechaza H01 lo cual
indica que el perfil de niñas es paralelo al perfil de niños.

(d) Representación gráfica de los perfiles para el grupo de los niños y niñas

15

También podría gustarte