Está en la página 1de 4

Primera Prueba Parcial

Asignatura: Métodos Multivariados

Carrera: Ingeniería Civil Industrial

Felipe Méndez Acosta

1.- a) Muestre que si x  N p ( , 1 ) y y  N P (v,  2 ) se tiene que

los vectores x, y son independientes   ( x, y) = I

b) Muestre que para la matriz de v-c es positiva definida y por lo tanto

sus valores propios son positivos

Problema 1 A) X, Y son independiente siempre que f(x,y)=f(x) ∙ f(y)


𝑛 −1 (𝑥𝑖−𝜇)
𝑒 (−1/2 ∑0 (𝑥𝑖−𝜇)´Σ
𝑵𝒑 (μ, Σ) = det (2𝜋Σ)𝑛/2
Si aplicamos logaritmo
𝑛 𝑛 𝑛
𝐿𝑜𝑔𝐿(𝜇, 𝛴) = − 2 𝑙𝑜𝑔𝑑𝑒𝑡(2𝜋Σ) − 2 𝑡𝑟(Σ−1 𝑆) − 2 ((𝑥 − 𝜇)´Σ−1 (𝑥 − 𝜇)
∂ ∂ 𝑛
∂μ
𝐿𝑜𝑔𝐿 = 𝑛Σ−1 (𝑥 − 𝜇) = 0 𝑦 ∂Σ−1
𝐿𝑜𝑔𝐿 = 2 (𝛴 − 𝑆 − (𝑥 − 𝜇) (𝑥 − 𝜇)´)=0
Al hacer una dócima de independencia estocástica de las variables:
Ho: (𝜇⃗, 𝛴1 ) 𝑠 = 2𝑝
H1: (𝑣⃗, 𝛴2 ) r = p + p(p + 1)/2
donde 𝛴 es diagonal. Ho contiene las p medias de las variables y las p varianzas. 𝛴 es cualquier matriz definida positiva.
2 log λ 𝑅 = −n log |R|donde R es la matriz de correlaciones. El estadístico n log |R| es asintóticamente ji-cuadrado con
𝒒 = 𝒑 + 𝒑(𝒑 + 𝟏)/(𝟐 − 𝟐𝒑) = 𝒑(𝒑 − 𝟏)/𝟐
𝑨𝒔í 𝒔𝒆 𝒄𝒐𝒎𝒑𝒓𝒖𝒆𝒃𝒂 𝒒𝒖𝒆 𝒂𝒍 𝒔𝒆𝒓 𝒊𝒏𝒅𝒆𝒑𝒆𝒏𝒅𝒊𝒆𝒏𝒕𝒆𝒔, 𝒔𝒆 𝒕𝒊𝒆𝒏𝒆𝒆 𝑹 ≈ 𝑰; −𝒏 𝒍𝒐𝒈𝑹 ≈ 𝟎
⃗⃗⃗⃗⃗𝑡 ∙ 1 ∙ 𝑥 𝑡 ∙ 𝐻 ∙ 𝑥 ∙ 𝑦⃗ > 0
Problema 1 B) Para que sea positiva se debe demostrar que 𝑦 𝑛
1
1° 𝐻 = 𝐻 => 𝐻 = (𝐼𝑛 − ∙ ⃗1⃗ ∙ ⃗⃗⃗⃗
1 1
1𝑡 )𝑡
𝑛
1 1
=𝐼𝑛 − ∙ (1 ⃗⃗ ∙ ⃗⃗⃗⃗
1𝑡 )𝑡 = 𝐼𝑛 − ∙ ⃗⃗⃗⃗⃗⃗⃗ (1𝑡 )𝑡 ∙ ⃗⃗⃗⃗
1𝑡
𝑛 𝑛
1
= 𝐼𝑛 − ∙ 1 ⃗⃗ ∙ ⃗⃗⃗⃗
1𝑡 = 𝐻
𝑛
1
F2° 𝐻 = 𝐻2 => 𝐻2 = (𝐼𝑛 − 𝑛 ∙ 1 ⃗⃗ ∙ ⃗⃗⃗⃗
1𝑡 )2
2 1
=𝐼𝑛 2 − ∙ 𝐼𝑛 ∙ 1 ⃗⃗ ∙ ⃗⃗⃗⃗
1𝑡 + 2 ∙ (1 ⃗⃗ ∙ ⃗⃗⃗⃗
1𝑡 )2
𝑛 𝑛
1
=𝐼𝑛 − 𝑛 ∙ ⃗1⃗ ∙ ⃗⃗⃗⃗
1𝑡 = 𝐻
Luego en 1: 𝑦 ⃗⃗⃗⃗⃗𝑡 ∙ 1 ∙ 𝑥 𝑡 ∙ 𝐻2 ∙ 𝑥 ∙ 𝑦⃗ > 0
𝑛
1
⃗⃗⃗⃗⃗ ∙ ∙ 𝑥 𝑡 ∙ 𝐻 ∙ 𝑥 ∙ 𝑦⃗ > 0
𝑡
𝑦
𝑛
1 ⃗⃗⃗⃗⃗𝑡 𝑡
∙ 𝑦 ∙ 𝑥 ∙ 𝐻𝑡 ∙ H ∙ x ∙ 𝑦⃗ > 0
𝑛
Sea 𝑏⃗⃗ = 𝐻 𝑥 𝑦⃗; ⃗⃗⃗⃗ 𝑏𝑡 = (𝐻 𝑥 ⃗⃗⃗) y 𝑡 = 𝑦 𝑡 ∙ 𝑥 𝑡 ∙ 𝐻𝑡
1 ⃗⃗⃗⃗𝑡
∙𝑏 ∙b > 0
𝑛
𝟏
∙ ‖𝒃‖ > 𝟎
𝒏

2.- Considere las matrices que representan dos muestreos aleatorios de dos poblaciones

distintas 1 , 2

3.7 5 6.3 3.6


4 4 5.8 4.5
5.5 5 
4
 5.3  4.3 5 5.9 4.7
4.6 4.5 5.5 5  
X1 =   X 2 = 4.2 6 6.4 4.4
 4.3 4.8 6.2 4.5  
5 5 5.8 4.8 3.5 5.7 6 4.3
  3.9 5.4 5.7 5 
 4 5.2 6.3 5.2

Docime con un 5% de error como máximo

a) Si las matrices de v-c son iguales

b) Si los vectores medios son iguales

Problema 2 A) Datos del problema: 𝑛1 = 6, 𝑛2 = 5 𝑛 = 11


1 1 𝑛 ∙𝑆 +𝑛 ∙𝑆
𝑆1 (6) = ∙ 𝑋1 𝑡 ∙ 𝐻6 ∙ 𝑋1. 𝑆 2 (5) = ∙ 𝑋1 𝑡 ∙ 𝐻5 ∙ 𝑋1. 𝑆𝑝 = 1 1 2 2
6 5 𝑛1 +𝑛2
𝐷𝑒𝑡(𝑆1 (6) ) = 0,000168 𝐷𝑒𝑡(𝑆 2 (5) ) = 0,000005 𝐷𝑒𝑡(𝑆𝑝 ) = 0,000285
Dócima:
i) 𝐻𝑜 ∑1 = ∑2 ii)𝐻1 ∑1 ≠ ∑2 iii)𝛼 = 0,05 iv) 𝑋𝑜𝑏𝑠 2 = 𝑛 ∙ ln( 𝑆𝑝 ) − (𝑛1 ∙ ln(𝑆1 ) + 𝑛2 ∙ ln(𝑆 2 ))
𝑝(𝑝+1)
v) Etapa de decisión 𝑋𝑜𝑏𝑠 2 ~𝑋 2 ( 2
) 𝑋𝑜𝑏𝑠 2 ~𝑋(6) 2Valores críticos: 𝑋0,025 2 (10) = 3,247 𝑋0,975 2 (10) = 20,483
Como 𝑋𝑜𝑏𝑠 2 = 23,6624 𝑋0,975 <𝑋𝑜𝑏𝑠 2
2
Se rechaza Ho Conclusión: ∑1 ≠ ∑2

Problema 2 B) Al docimar se pudo concluir que las matrices v-c son distintas. Además, sabemos que son desconocidas.
Dócima:
⃗⃗⃗⃗⃗1 − ⃗⃗⃗⃗⃗ 𝑆 𝑆 −1 ⃗⃗⃗⃗⃗ ⃗⃗⃗⃗⃗
i)𝐻𝑜: 𝜇
⃗⃗⃗⃗⃗1 = ⃗⃗⃗⃗⃗
𝜇2 ii)𝐻𝑜: 𝜇
⃗⃗⃗⃗⃗1 ≠ ⃗⃗⃗⃗⃗
𝜇2 iii)𝛼 = 0,05 iv) 𝑋𝑜𝑏𝑠 2 = (𝑥 𝑥2 )𝑡 ( 1 + 2 ) (𝑥 1 − 𝑥2 )
𝑛1 𝑛2
4.26667 3.98
⃗⃗⃗⃗⃗ 4.96667 ⃗⃗⃗⃗⃗2 = [5.22]
𝑥1 = [ ] 𝑥
5.93333 5.96
4.68333 4.68
𝑋𝑜𝑏𝑠 2 = 2.18102
v) Etapa de decisión: 𝑋0,025 2 (4) = 0,485 𝑋0,975 2 (4) = 11,143
2
Como 𝑋0,025 2 < 𝑋𝑜𝑏𝑠 No se rechaza Ho. Conclusión ⃗⃗⃗⃗⃗
𝜇1 = ⃗⃗⃗⃗⃗
𝜇2

3.- a) Considere solo la población 1 y la cuarta columna como la variable dependiente

Ajuste los modelos

y = a + be − x1 + c cos(x 2 ) + d x3 + 
b
y = ax1 + + csen (3 x3 ) + 
2
3
x2

b) Si le piden elegir uno de los dos modelos ¿Cuál propone? Justifique

Problema 3A) Para el modelo 𝑦 = 𝑎 + 𝑏𝑒 −𝑥1 + 𝑐 𝑐𝑜𝑠( 𝑥2 ) + 𝑑√𝑥3 + 𝜉


Coeficientes
Estadísticas de la regresión Intercepción 10,4387341
Coeficiente de correlación múltiple 0,69863031 Variable X 1 -52,9650529
Coeficiente de determinación R^2 0,48808431 Variable X 2 0,88570169
R^2 ajustado -0,27978922 Variable X 3 -2,12025153
Por lo tanto, el modelo queda: 𝑦̂ = 10,4387341 − 52,9650529𝑒 −𝑥1 + 0,88570169𝑥2 ) − 2,12025153√𝑥3

𝑏
Para el modelo 𝑦 = 𝑎𝑥1 2 + 𝑥 3 + 𝑐𝑠𝑒𝑛(3𝑥3 )
2
Coeficientes
Estadísticas de la regresión
Intercepción 0
Coeficiente de correlación múltiple 0,98725933 Variable X 1 0,21340865
Coeficiente de determinación R^2 0,97468098 Variable X 2 128,778578
R^2 ajustado 0,62446829 Variable X 3 0,91014153
128,778578
Por lo tanto el modelo queda: : 𝑦̂ = 0,21340865𝑥1 2 + + 0,91014153𝑠𝑒𝑛 (3𝑥3 )
𝑥2 3

Problema 3B) Será necesario estudiar su coeficiente de determinación, como también la significancia de los modelos.
Modelo 1. ¿Es significativo?
𝑖) 𝐻𝑂: 𝑏 = 𝑐 = 0 ii) 𝐻1: 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 1 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑒𝑠 𝑛𝑜 𝑛𝑢𝑙𝑜. Iii) 𝛼 = 0,05
iv) 𝑆𝑖 𝐹𝑜𝑏𝑠 > 𝐹(0.95) (2,3) Se rechaza Ho. 𝐹𝑜𝑏𝑠 = 0.6356 ~ 𝐹(3,2) 𝐹(3,2) = 19.164
𝑷𝒐𝒓 𝒍𝒐 𝒕𝒂𝒏𝒕𝒐 𝒏𝒐 𝒔𝒆 𝒓𝒆𝒄𝒉𝒂𝒛𝒂 𝐻𝑜. 𝑳𝒐 𝒒𝒖𝒆 𝒊𝒎𝒑𝒍𝒊𝒄𝒂 𝒒𝒖𝒆 𝒆𝒍 𝒎𝒐𝒅𝒆𝒍𝒐 𝒏𝒐 𝒆𝒔 𝒔𝒊𝒈𝒏𝒊𝒇𝒊𝒄𝒂𝒕𝒊𝒗𝒐.

Modelo 2. ¿Es significativo?


𝑖) 𝐻𝑂: 𝑏 = 𝑐 = 0 ii) 𝐻1: 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 1 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑒𝑠 𝑛𝑜 𝑛𝑢𝑙𝑜. Iii) 𝛼 = 0,05
( )
iv) 𝑆𝑖 𝐹𝑜𝑏𝑠 > 𝐹(0.98) 3,3 Se rechaza Ho. 𝐹𝑜𝑏𝑠 = 38.49599 ~ 𝐹(3,3) 𝐹(3,3) = 9.276
𝑷𝒐𝒓 𝒍𝒐 𝒕𝒂𝒏𝒕𝒐 𝒔𝒆 𝒓𝒆𝒄𝒉𝒂𝒛𝒂 𝐻𝑜. 𝑳𝒐 𝒒𝒖𝒆 𝒊𝒎𝒑𝒍𝒊𝒄𝒂 𝒒𝒖𝒆 𝒆𝒍 𝒎𝒐𝒅𝒆𝒍𝒐 𝒆𝒔 𝒔𝒊𝒈𝒏𝒊𝒇𝒊𝒄𝒂𝒕𝒊𝒗𝒐.

Cuando se trata de la predicción se debe elegir el modelo que el mayor coeficiente de determinación
𝑅2 . Mientras más cerca de 1 sea el valor de 𝑅2 , mejor modelo es en contexto de predicción. Como se
identificó anteriormente.
Modelo 1 Modelo 2
Coeficiente de determinación R^2 0,48808431 0,97468098
Finalmente se puede estudiar qué tan depurada está la información a través de la dependencia de las
variables.
Columna 1 Columna 2 Columna 3
Columna 1 1
Columna 2 0,48019498 1
Columna 3 0,4945197 0,2122681 1
Relaciones correlación Modelo 1

Columna 1 Columna 2 Columna 3


Columna 1 1
Columna 2 0,42755963 1
Columna 3 -0,7948266 -0,2121249 1
Relaciones correlación Modelo 2
Con todo esto, se concluye que el modelo número 2 es el más recomendable.

Nota: Exponga sus resultados en solo dos hojas claramente legibles explicite los resultados más

importantes. Resultados los pueden subir a mensajes loa

También podría gustarte