Está en la página 1de 28

ESTADISTICA INFERENCIAL

Recordemos algunos conceptos de la clase anterior

Utilizamos regresión múltiple cuando estudiamos la


posible relación entre varias variables independientes
(predictoras o explicativas) y otra variable dependiente
(criterio, explicada, respuesta).

Inicio
SABERES PREVIOS

1. Que es una matriz de varianza-


covarianza?
2. Que es un intervalo de
confianza?
3. Que es un intervalo de
predicción?
Utilidad
La matriz varianza-covarianza es muy popular en
econometría dado que se usa principalmente en el cálculo
matricial de los coeficientes de la regresión lineal
mediante Mínimos Cuadrados Ordinarios, entre otros
usos
LOGRO DE SESION

Al finalizar la clase los alumnos desarrollan los conceptos de la matriz de


varianzas-covarianzas, intervalo de confianza e intervalo de predicción a fin de
poder aplicarlo en situaciones del campo de las ciencias y la ingeniería
MATRIZ VARIANZA - COVARIANZA
Una matriz de varianzas-covarianzas es una matriz cuadrada que contiene las
varianzas y covarianzas asociadas con diferentes variables.

Los elementos de la diagonal de la matriz contienen las varianzas de las


variables, mientras que los elementos que se encuentran fuera de la diagonal
contienen las covarianzas entre todos los pares posibles de variables.
MATRIZ DE VARIANZA - COVARIANZA
La matriz de varianzas – covarianzas viene definida de la siguiente manera:

[ ]
2
𝜎𝑦 𝑆 𝑦𝑋 1
… 𝑆𝑦 𝑋 𝑚
2
𝑆𝑋 𝜎 … ⋮
𝑉𝐶= 1 𝑦 𝑋1

⋮ ⋮ ⋱ ⋮
2
𝑆𝑋 𝑛
𝑦 … … 𝜎𝑋 𝑚

Donde:
MATRIZ DE VARIANZA - COVARIANZA

Para obtener los valores de la matriz de varianza – covarianza se realizan los


siguiente cálculos:
𝑁

∑𝑌2
𝑖=1
𝜎 2𝑦 = − 𝑌2
𝑁

∑ 𝑌𝑖 𝑋 1𝑖
𝑆𝑌 𝑋1 = 𝑖 =1 − 𝑌 𝑋 1𝑖
𝑁

De la misma manera para cada variable que se tenga del modelo de regresión
múltiple.
MATRIZ VARIANZA - COVARIANZA
Ejercicios
El gerente de una empresa estudia las posibles relaciones entre beneficios
anuales, gastos en publicidad anuales y horas extraordinarias anuales de los
empleados. Para ello utiliza datos, de estas tres variables, proporcionadas por
algunas empresas del sector:
Beneficios Gastos Publicidad Horas extras
(millones) (millones) (100 horas)
1.3 0.3 4
3.5 1.5 9
2.8 0.7 6
3 1.1 7.5
3.3 1.2 8
4 2 7
3.7 2 8

Se desea estimar la matriz de varianza-covarianza


MATRIZ VARIANZA - COVARIANZA
Solución:
Beneficios Gastos Publicidad Horas extras
Y^2 X1^2 X2^2 YX1 YX2 X1X2
(millones) (millones) (100 horas)
1.3 0.3 4 1.69 0.09 16 0.39 5.2 1.2
3.5 1.5 9 12.25 2.25 81 5.25 31.5 13.5
2.8 0.7 6 7.84 0.49 36 1.96 16.8 4.2
3 1.1 7.5 9 1.21 56.25 3.3 22.5 8.25
3.3 1.2 8 10.89 1.44 64 3.96 26.4 9.6
4 2 7 16 4 49 8 28 14
3.7 2 8 13.69 4 64 7.4 29.6 16

∑ 𝑌=21.6 ∑ 𝑋 1=8.8 ∑ 𝑋 2=49.5 ∑ 𝑋 1 𝑌=30.26 ∑ 𝑋 2 𝑌=160 ∑ 𝑋 1 𝑋 2=66.7


∑ 𝑌 =71.36 ∑ 𝑋 =13.48∑ 𝑋 =366.25𝑌=3.0857 𝑋 1=1.2571 𝑋 2=7.0714
2 2
1
2
2
MATRIZ VARIANZA - COVARIANZA
Realizamos los cálculos necesarios:

En consecuencia, la matriz de varianza – covarianza es:

VC
INTERVALO DE CONFIANZA
Como en la regresión lineal simple, en la regresión múltiple es posible interpretar
el valor ŷ de dos formas, ŷ puede interpretarse como la estimación de la media de
la subpoblación de los valores de Y que se supone existen para combinaciones
particulares de valores Xi.

La segunda interpretación indica que ŷ es el valor que más probablemente


asumirá y para los valores dados de las Xi.
INTERVALO DE CONFIANZA
Intervalo de confianza para la respuesta media:
De acuerdo con esta interpretación, ŷ es una estimación, y cuando se utiliza para
este propósito, a la ecuación se le llama ecuación de estimación.
Cuando ŷ se interpreta como, una estimación de la media de la población, al
intervalo se le llama intervalo de confianza.

Donde:
• La distribución t con n – k– 1 grados de libertad (k: número de variables
independientes)
• es el vector que contiene los valores de las variables independientes para los
cuales se desea hacer el pronóstico.
• CME es:
INTERVALO DE CONFIANZA
Intervalo de predicción para
En este caso, ŷ es el valor pronosticado o valor de predicción de y, y a la ecuación
se le llama ecuación de predicción.
Cuando ŷ se interpreta como un valor de predicción de y, al intervalo se le llama
intervalo de predicción.

Donde:
La distribución t con n – k– 1 grados de libertad y CME es:
INTERVALO DE CONFIANZA
Ejercicio
El gerente de una empresa estudia las posibles relaciones entre beneficios anuales,
gastos en publicidad anuales y horas extraordinarias anuales de los empleados. Para ello
utiliza datos, de estas tres variables, proporcionadas por algunas empresas del sector. Se
desea saber:
Beneficios Gastos Publicidad Horas extras
(millones) (millones) (100 horas)
1.3 0.3 4
3.5 1.5 9
2.8 0.7 6
3 1.1 7.5
3.3 1.2 8
4 2 7
3.7 2 8

a) Halle el intervalo de confianza al 5% de significación para la estimación de los


beneficios si se tiene un gasto en publicidad de 1 y 5 horas extras.
b) Halle el intervalo de predicción al 5% de significación para la estimación de los
beneficios si se tiene un gasto en publicidad de 1 y 5 horas extras.
INTERVALO DE CONFIANZA
Solución:
Beneficios Gastos Publicidad Horas extras
Y^2 X1^2 X2^2 YX1 YX2 X1X2
(millones) (millones) (100 horas)
1.3 0.3 4 1.69 0.09 16 0.39 5.2 1.2
3.5 1.5 9 12.25 2.25 81 5.25 31.5 13.5
2.8 0.7 6 7.84 0.49 36 1.96 16.8 4.2
3 1.1 7.5 9 1.21 56.25 3.3 22.5 8.25
3.3 1.2 8 10.89 1.44 64 3.96 26.4 9.6
4 2 7 16 4 49 8 28 14
3.7 2 8 13.69 4 64 7.4 29.6 16

∑ 𝑌=21.6 ∑ 𝑋 1=8.8 ∑ 𝑋 2=49.5 ∑ 𝑋 1 𝑌=30.26 ∑ 𝑋 2 𝑌=160 ∑ 𝑋 1 𝑋 2=66.7


∑ 𝑌 =71.36 ∑ 𝑋 =13.48∑ 𝑋 =366.25𝑌=3.0857 𝑋 1=1.2571 𝑋 2=7.0714
2 2
1
2
2
^ = 𝛽 + 𝛽 𝑋 + 𝛽 𝑋 = 0.590 +0.936 𝑋 +0.187 𝑋
𝑌 0 1 1 2 2 1 2
INTERVALO DE CONFIANZA
Solución a):
^ = 𝛽 + 𝛽 𝑋 + 𝛽 𝑋 = 0.590+0.936 𝑋 +0.187 𝑋
𝑌 0 1 1 2 2 1 2

Reemplazando los valores y en la ecuación estimada:

[ ]
Para el intervalo de confianza: 𝑛 𝑛
𝑛 ∑ 𝑋1 𝑖 ∑ 𝑋 2𝑖
𝑖=1 𝑖=1

[]
1 𝑛 𝑛 𝑛

∑ 𝑋 1𝑖 ∑𝑋 ∑ 𝑋 1𝑖 𝑋 2 𝑖
Siempre anteponer el valor 𝑇
𝑥 𝑜= 1 𝐴= 𝑋 ´ 𝑋= 𝑋 𝑋= 2
1𝑖
5 1 en la matriz
𝑖=1 𝑖=1 𝑖=1

[ ]
3 .632 0.585 − 0.598 𝑛 𝑛 𝑛

∑ 𝑋 2𝑖 ∑ 𝑋 1𝑖 𝑋 2𝑖 ∑ 𝑋 2𝑖2
′ −1
( 𝑋 𝑋 ) = 0.585 0.845 − 0.233
−0.598 − 0.233 0.126
𝑖=1 𝑖=1 𝑖=1
INTERVALO DE CONFIANZA
Solución:
Reemplazando los valores y en la ecuación estimada:

Para el intervalo de confianza necesitamos los siguientes valores:


′ ′ ′
𝛽 = [ 0.590 0.187 ]

𝑦 𝑦 =451.09 0.936 𝛽 𝑋 𝑦=70.987

¿ √ 451.09 −70.987
=4.874
7 − 2− 1
INTERVALO DE CONFIANZA
Solución:
El intervalo de confianza será:
t(1-α/2)= 2.776

√ [ ][ ]
3.632 0.585 − 0.598 1
𝐼𝐶 ( 𝜇 𝑦 / 𝑥 ) =2.461 ± 2.776
𝑜
4.874 ∗ [ 1 1 5 ] 0.585 0.845 − 0.233 1
− 0.598 − 0.233 0.126 5
INTERVALO DE CONFIANZA
Solución b):
^ = 𝛽 + 𝛽 𝑋 + 𝛽 𝑋 = 0.590+0.936 𝑋 +0.187 𝑋
𝑌 0 1 1 2 2 1 2

Reemplazando los valores y en la ecuación estimada:

Para el intervalo de predicción:

[] [ ]
1 3 .632 0.585 − 0.598
𝑥 𝑜= 1 Siempre anteponer el valor ′ −1
( 𝑋 𝑋 ) = 0.585 0.845 − 0.233
5 1 en la matriz −0.598 − 0.233 0.126
INTERVALO DE CONFIANZA
Solución:
El intervalo de predicción será:
t(1-α/2)= 2.776

√ [ ][ ]
3 .632 0.585 − 0.598 1
𝐼𝑃 ( 𝑦 )=2.461 ± 2.776 ( 4.874)∗ [1+ [ 1 1 5 ] 0.585 0.845 − 0.233 1 ]
− 0.598 − 0.233 0.126 5
Vamos a los ejercicios propuestos a
continuación los cuales resolverán en
forma individual
EJERCICIO ADICIONAL
Partiendo de la siguiente información:

Obtener la matriz de varianza - covarianza


EJERCICIO ADICIONAL
Solución:

∑ 𝑌=100 ∑ 𝑋 1=62 ∑ 𝑋 2=90 ∑ 𝑋 1 𝑌=843 ∑ 𝑋 2 𝑌=621 ∑ 𝑋 1 𝑋 2=405


∑ 𝑌 =1416 ∑ 𝑋 =514 ∑ 𝑋 =1014 𝑌 =10 𝑋 1=6.2 𝑋 2=9
2 2
1
2
2
EJERCICIO ADICIONAL
Realizamos los cálculos necesarios:

En consecuencia, la matriz de varianza – covarianza es:

VC
EJERCICIO ADICIONAL
Se presentan los gastos en alimentación de una familia en base a la información que proporcionan
las variables regresoras 'ingresos mensuales y 'número de miembros de la familia'. Para ello se
recoge una muestra aleatoria simple de 15 familias, cuyos resultados se facilitan en la tabla adjunta.
(El gasto e ingreso se expresan en cien mil euros).

Obtener la matriz de varianza - covarianza


CIERRE
¿QUÉ HEMOS APRENDIDO?
1. ¿Para que se utiliza la Matriz de
Varianza-Covarianzas?

2. ¿Por qué será importante calcular los


intervalos de confianza para la respuesta
media e intervalo de predicción de Yo?

También podría gustarte