Está en la página 1de 2

UNIVERSIDAD NACIONAL DE COLOMBIA - SEDE MEDELLÍN

FACULTAD DE CIENCIAS
ESTADÍSTICA II- SEMESTRE 2021-I
TALLER #4
Nociones preliminares relacionadas con vectores de variables aleatorias (valor esperado y matriz de varianzas-covarianzas).
Modelo de RLM y su enfoque matricial. Estimación de los parámetros del modelo. Interpretación y propiedades de los
estimadores de mínimos cuadrados.

1. ¿Cuál de las siguientes afirmaciones es falsa?

a. La matriz de varianzas-covarianzas siempre es simétrica respecto a su diagonal principal.


b. La covarianza entre dos covariables, X1 y X2, es un valor que indica el grado de variación
conjunta de tales variables. Si la covarianza es positiva, significa que cuando X1 crece entonces
X2 también lo hace, por otro lado, una covarianza negativa, indica que cuando X 1 crece, X2
decrece.
c. El vector de medias asociado a un vector aleatorio de longitud k, tendrá longitud k.
d. La matriz de varianzas y covarianzas siempre tiene unos en su diagonal principal.
2. Considere el siguiente modelo de regresión lineal múltiple con 𝑘 variables regresoras, 𝑝 = 𝑘 +
1 parámetros y 𝑛 > 𝑘.

𝑌𝑖 = 𝛽0 + 𝛽1 X𝑖1 + 𝛽2 X𝑖2 + 𝛽3 X𝑖3 + ⋯ + 𝛽𝑘 X𝑖k + 𝜀𝑖 , 𝜀𝑖 ~𝑖𝑖𝑑 𝑁(0, 𝜎 2 ) ∀𝑖, 𝑖 = 1,2, … , 𝑛

a. Escriba el modelo en forma matricial, junto con sus supuestos.


b. Demuestre que el estimador 𝛽̂ = (𝑋′𝑋)−1 𝑋 ′ 𝑌 que se encuentra por el método de mínimos
cuadrados es un estimador insesgado de 𝛽.
c. Al realizar la prueba de significancia del parámetro 𝛽̂𝑗 (j=1,2,…k). De resultar este significativo
¿Cómo se interpretaría?

3. Un ingeniero realizó un experimento para determinar el rendimiento total del aceite por lote de
cacahuate, para ello tuvo en cuenta variables como la presión, temperatura del CO2 aplicado, la
humedad y el tamaño de partícula de los cacahuates. Los 16 datos recolectados aparecen a
continuación:

Rendimiento (Y) Presión (X1) Temperatura (X2) Humedad (X3) Tamaño de partícula
(X4)

63 415 25 7 1.28
21 550 25 6 4.05
36 415 95 7 4.05
99 550 95 4 1.28
24 415 25 16 4.05
66 550 25 15 1.28
71 415 95 17 1.28
54 550 95 12 4.05
23 415 25 6 4.05
74 550 25 4 1.28
80 415 95 8 1.28
33 550 95 5 4.05
63 415 25 15 1.28
21 550 25 14 4.05
44 415 95 15 4.05
96 550 95 12 1.28

Tabla 1. Datos de estudio sobre el rendimiento total de aceite por lote de cacahuate.
Coefficients:
Estimate Std. Error t value Pr(>|t|)

(Intercept) 55.17939 16.97067 3.251 0.007715 **


x1 0.05385 0.02957 1.821 0.095872 .
x2 0.28162 0.05512 5.109 0.000339 ***
x3 -0.09679 0.43700 -0.221 0.828776
x4 -16.06935 1.39178 -11.546 1.73e-07 ***

Tabla 2. Parámetros estimados

a. Plantee el modelo de RLM en forma matricial junto con sus supuestos, especificando cual es
la matriz de coeficientes y cuál es el vector de parámetros.
b. Ajuste el modelo de RLM.
c. Pruebe la significancia de los parámetros e interprete.

PROGRAMA R

#LECTURA DE DATOS
Punto3<-read.table(file.choose(), header=T, dec=".")
punto4
attach(punto4)
modelo<-lm(Y~X1+X2+X3+X4+X5)

#ESTADÍSTICOS DE RESUMEN
summary(modelo)

También podría gustarte