Está en la página 1de 24

ESTADISTICA INFERENCIAL

INICIO (10min)

• Actividad: Los estudiantes comparten con el docente las dudas que


hubieran existido en la sesión anterior.
• El estudiante responde con atención sobre los conocimientos que
tiene sobre Análisis de Regresión Lineal Múltiple
1. Que es un Modelo de Análisis de Regresión Lineal Múltiple?
2. Para que sirve un Modelo de Análisis de Regresión Lineal Múltiple?

Inicio
SABERES PREVIOS

ANALISIS DE REGRESION LINEAL MULTIPLE

1. Que es una matriz de varianza-covarianza?


2. Que es un intervalo de confianza?
3. Que es un intervalo de predicción?
LOGRO DE SESION

Al finalizar la clase los alumnos desarrollan los conceptos de la matriz de


varianzas-covarianzas, intervalo de confianza e intervalo de predicción a fin de
poder aplicarlo en situaciones del campo de las ciencias y la ingeniería
TRANSFORMACIÓN (60 min)
Principio pedagógico: Aprendizaje autónomo y Aprendizaje colaborativo.

• Actividad: A continuación el estudiante va revisar los conceptos básicos


correspondientes a la matriz de varianza-covarianza y se van a resolver
ejercicios para poder desarrollar los conceptos revisados en clase.

Transformación
MATRIZ VARIANZA - COVARIANZA
Una matriz de varianzas-covarianzas es una matriz cuadrada que contiene las
varianzas y covarianzas asociadas con diferentes variables.

Los elementos de la diagonal de la matriz contienen las varianzas de las


variables, mientras que los elementos que se encuentran fuera de la diagonal
contienen las covarianzas entre todos los pares posibles de variables.
MATRIZ DE VARIANZA - COVARIANZA
La matriz de varianzas – covarianzas viene definida de la siguiente manera:

  𝜎 2𝑦 𝑆 𝑦𝑋 … 𝑆𝑦 𝑋

[ ]
1 𝑚
2
𝑆𝑋 𝜎 … ⋮
𝑉𝐶 = 1 𝑦 𝑋1

⋮ ⋮ ⋱ ⋮
𝑆𝑋 𝑛 𝑦 … … 𝜎 2𝑋 𝑚

 Donde:
MATRIZ DE VARIANZA - COVARIANZA

Para obtener los valores de la matriz de varianza – covarianza se realizan los


siguiente cálculos:
𝑁
  ∑ 𝑌𝑖
2 𝑖=1 ´ 2
𝜎 = 𝑦 −𝑌
𝑁

𝑁
  ∑ 𝑌 𝑖 𝑋1𝑖
𝑖=1 ´ 𝑋
´ 1𝑖
𝑆𝑌 𝑋1 = −𝑌
𝑁

De la misma manera para cada variable que se tenga del modelo de regresión
múltiple.
MATRIZ VARIANZA - COVARIANZA
Ejercicios
El gerente de una empresa estudia las posibles relaciones entre beneficios
anuales, gastos en publicidad anuales y horas extraordinarias anuales de los
empleados. Para ello utiliza datos, de estas tres variables, proporcionadas por
algunas empresas del sector:
Beneficios Gastos Publicidad Horas extras
(millones) (millones) (100 horas)
1.3 0.3 4
3.5 1.5 9
2.8 0.7 6
3 1.1 7.5
3.3 1.2 8
4 2 7
3.7 2 8

a) Se desea estimar la matriz de varianza-covarianza


MATRIZ VARIANZA - COVARIANZA
Solución:
Beneficios Gastos Publicidad Horas extras
Y^2 X1^2 X2^2 YX1 YX2 X1X2
(millones) (millones) (100 horas)
1.3 0.3 4 1.69 0.09 16 0.39 5.2 1.2
3.5 1.5 9 12.25 2.25 81 5.25 31.5 13.5
2.8 0.7 6 7.84 0.49 36 1.96 16.8 4.2
3 1.1 7.5 9 1.21 56.25 3.3 22.5 8.25
3.3 1.2 8 10.89 1.44 64 3.96 26.4 9.6
4 2 7 16 4 49 8 28 14
3.7 2 8 13.69 4 64 7.4 29.6 16

∑ 𝑌=21.6 ∑ 𝑋1=8.8 ∑ 𝑋2=49.5∑ 𝑋1 𝑌=30.26∑ 𝑋2 𝑌=160∑ 𝑋1 𝑋2=66.7


 

2 2 2
∑ 𝑌 =71.36 ∑ 𝑋 =13.48 ∑ 𝑋 =366.25 𝑌´ =3.0857 𝑋´ 1=1.2571 𝑋´ 2=7.0714
 
1 2
MATRIZ VARIANZA - COVARIANZA
Realizamos los cálculos necesarios:

En consecuencia, la matriz de varianza – covarianza es:


INTERVALO DE CONFIANZA
Como en la regresión lineal simple, en la regresión múltiple es posible interpretar
el valor ŷ de dos formas, ŷ puede interpretarse como la estimación de la media de
la subpoblación de los valores de Y que se supone existen para combinaciones
particulares de valores Xi.

La segunda interpretación indica que ŷ es el valor que más probablemente


asumirá y para los valores dados de las Xi.
INTERVALO DE CONFIANZA
Intervalo de confianza para la respuesta media:
De acuerdo con esta interpretación, ŷ es una estimación, y cuando se utiliza para
este propósito, a la ecuación se le llama ecuación de estimación.
Cuando ŷ se interpreta como, una estimación de la media de la población, al
intervalo se le llama intervalo de confianza.

 Donde:
• La distribución t con n – k– 1 grados de libertad (k: número de variables
independientes)
• es el vector que contiene los valores de las variables independientes para los
cuales se desea hacer el pronóstico.
• CME es:
INTERVALO DE CONFIANZA
 Intervalode predicción para
En este caso, ŷ es el valor pronosticado o valor de predicción de y, y a la ecuación
se le llama ecuación de predicción.
Cuando ŷ se interpreta como un valor de predicción de y, al intervalo se le llama
intervalo de predicción.

Donde:
La distribución t con n – k– 1 grados de libertad y CME es:
INTERVALO DE CONFIANZA
Ejercicio
El gerente de una empresa estudia las posibles relaciones entre beneficios anuales,
gastos en publicidad anuales y horas extraordinarias anuales de los empleados. Para ello
utiliza datos, de estas tres variables, proporcionadas por algunas empresas del sector. Se
desea saber:
Beneficios Gastos Publicidad Horas extras
(millones) (millones) (100 horas)
1.3 0.3 4
3.5 1.5 9
2.8 0.7 6
3 1.1 7.5
3.3 1.2 8
4 2 7
3.7 2 8

a) Halle el intervalo de confianza al 5% de significación para la estimación de los


beneficios si se tiene un gasto en publicidad de 1 y 5 horas extras.
b) Halle el intervalo de predicción al 5% de significación para la estimación de los
beneficios si se tiene un gasto en publicidad de 1 y 5 horas extras.
INTERVALO DE CONFIANZA
Solución:
Beneficios Gastos Publicidad Horas extras
Y^2 X1^2 X2^2 YX1 YX2 X1X2
(millones) (millones) (100 horas)
1.3 0.3 4 1.69 0.09 16 0.39 5.2 1.2
3.5 1.5 9 12.25 2.25 81 5.25 31.5 13.5
2.8 0.7 6 7.84 0.49 36 1.96 16.8 4.2
3 1.1 7.5 9 1.21 56.25 3.3 22.5 8.25
3.3 1.2 8 10.89 1.44 64 3.96 26.4 9.6
4 2 7 16 4 49 8 28 14
3.7 2 8 13.69 4 64 7.4 29.6 16

∑ 𝑌=21.6 ∑ 𝑋1=8.8 ∑ 𝑋2=49.5∑ 𝑋1 𝑌=30.26∑ 𝑋2 𝑌=160∑ 𝑋1 𝑋2=66.7


 

2 2 2

 
𝑌 =71.36 ∑ 𝑋 =13.48
1 ∑ 𝑋 =366.25 𝑌
´2=3.0857 𝑋
´ 1 =1.2571 𝑋
´ 2=7.0714
 𝑌
^ = 𝛽 0 + 𝛽 1 𝑋 1 + 𝛽 2 𝑋 2=0.590 +0.936 𝑋 1+0.187 𝑋 2
INTERVALO DE CONFIANZA
Solución a):
 𝑌
^ = 𝛽 0 + 𝛽 1 𝑋 1 + 𝛽 2 𝑋 2=0.590+0.936 𝑋 1+0.187 𝑋 2
 Reemplazando los valores y en la ecuación estimada:

Para el intervalo de confianza:

1
 
[]
𝑥 𝑜= 1
5
Siempre anteponer el valor
1 en la matriz
  ′
( 𝑋 𝑋)
−1

[
3.632
= 0.585
− 0.598
0.585
0.845
− 0.233
− 0.598
− 0.233
0.126 ]
INTERVALO DE CONFIANZA
Solución:
 Reemplazando los valores y en la ecuación estimada:

Para el intervalo de confianza necesitamos los siguientes valores:


′ ′ ′ ′
 𝑦 𝑦=451.09 𝛽
  =[ 0 .590 0.936 0.187 ]  𝛽 𝑋 𝑦=70.987

  √ 451.09 −70.987
¿ =4.874
7 −2 −1
INTERVALO DE CONFIANZA
Solución:
El intervalo de confianza será:
t(1-α/2)= 2.776

  3 .632 0.585 − 0.598 1


𝑜


𝐼𝐶 ( 𝜇 𝑦 / 𝑥 ) =2.461 ± 2.776 4.874 ∗ [ 1 1
[
5 ] 0.585
− 0.598
0.845
− 0.233
− 0.233
0.126 ][ ]
1
5

 
INTERVALO DE CONFIANZA
Solución b):
 𝑌
^ = 𝛽 0 + 𝛽 1 𝑋 1 + 𝛽 2 𝑋 2=0.590+0.936 𝑋 1+0.187 𝑋 2
 Reemplazando los valores y en la ecuación estimada:

Para el intervalo de confianza:

1
 
[]
𝑥 𝑜= 1
5
Siempre anteponer el valor
1 en la matriz
  ′
( 𝑋 𝑋)
−1

[
3.632
= 0.585
− 0.598
0.585
0.845
− 0.233
− 0.598
− 0.233
0.126 ]
INTERVALO DE CONFIANZA
Solución:
El intervalo de confianza será:
t(1-α/2)= 2.776

  3 .632 0.585 − 0.598 1


𝐼𝑃 ( 𝑦 )=2.461 ± 2.776
√ (4.874) ∗ 1+ [ 1 1
[
5 ] 0.585
− 0.598
0.845
− 0.233
− 0.233
0.126 ][ ]
1
5

 
EJERCICIO ADICIONAL
Se presentan los gastos en alimentación de una familia en base a la información que proporcionan
las variables regresoras 'ingresos mensuales y 'número de miembros de la familia'. Para ello se
recoge una muestra aleatoria simple de 15 familias, cuyos resultados se facilitan en la tabla adjunta.
(El gasto e ingreso se expresan en cien mil euros).

Obtener la matriz de varianza - covarianza


CIERRE (15 min)
Principio pedagógico: Aprendizaje autónomo.

Actividad:
• El estudiante responde en el chat sobre 2 principales preguntas del
docente sobre su aprendizaje en la clase de hoy.

Cierre
CIERRE
¿QUÉ HEMOS APRENDIDO?
1. ¿Para que se utiliza la Matriz de
Varianza-Covarianzas?

2. ¿Por qué será importante calcular los


intervalos de confianza para la respuesta
media e intervalo de predicción de Yo?

También podría gustarte