Está en la página 1de 19

Semana 15: Sesión 30

Estadística Inferencial
Semana 15: Sesión 30

Matriz de varianzas y covarianzas.


Logro de la sesión

Al término de la sesión el estudiante construye e interpreta la


matriz de varianzas y covarianzas, para identificar el grado y el
sentido de correlación entre varias variables.
Matriz de varianzas y covarianzas

Definición:
Una matriz de varianzas y covarianzas es una matriz cuadrada, de
orden «n», formada por las varianzas y covarianzas asociadas a
diferentes variables.

El orden «n» de la matriz depende del número de dimensiones


que tenga la variable o el número de variables en estudio.
Matriz de varianzas y covarianzas

Propiedades de la matriz de varianzas y covarianzas:

 Es una matriz simétrica, respecto a su diagonal principal, por


tanto la covarianza de XY es igual a la Covarianza de YX.

 Es una matriz definida positiva: Su determinante no es nunca


negativa.
Matriz de varianzas y covarianzas

¿Cómo se forma la matriz?


La diagonal principal contiene a las varianzas 𝑆1 2 ; 𝑆2 2 … . 𝑆𝑛 2 , y
los elementos de entrada que se encuentran fuera de la diagonal
principal serán las covarianzas entre todos los pares posibles de
variables 𝑆1 2 ; 𝑆1 3 ; 𝑆1 4 … … .
Ejemplo:
𝑆1 2 : Representa la covarianza (variación conjunta) entre la
dimensión 1 y 2 de la variable
Matriz de varianzas y covarianzas
En general: Si X: es una variable de «n» dimensiones, la matriz de
varianzas y covarianzas estará representada como:

𝟐
𝑺𝟏 𝑆12 𝑆13 ⋯ 𝑆1𝑛
𝟐
𝑆21 𝑺𝟐 𝑆23 ⋯ 𝑆2𝑛
𝑉= 𝑆 𝟐⋯ 𝑆3𝑛
31 𝑆32 𝑺𝟑
⋮ ⋮ ⋮ ⋱ ⋮
𝑆𝑛1 𝑆𝑛2 𝑆𝑛3 ⋯ 𝟐
𝑺𝒏
Matriz de varianzas y covarianzas
Con la matriz de varianzas y covarianzas se construye la matriz de
correlaciones parciales (R), que se encarga de medir la relación
entre pares de variables eliminando, momentáneamente, el
efecto de las variables restantes.

𝟏 𝑟12 𝑟13 ⋯ 𝑟1𝑛


𝑟21 𝟏 𝑟23 ⋯ 𝑟2𝑛
R= 𝑟31 𝑟32 1 ⋯ 𝑟3𝑛
⋮ ⋮ ⋮ ⋱ ⋮
𝑟𝑛1 𝑟𝑛2 𝑟𝑛3 ⋯ 1
Matriz de varianzas y covarianzas
Los valores de las correlaciones parciales se obtiene como:

𝑆11 𝑆12 𝑆13



𝑆11 𝑆11 𝑆11 𝑆22 𝑆11 𝑆33
𝑆21 𝑆22 𝑆23

𝑅= 𝑆22 𝑆11 𝑆22 𝑆22 𝑆22 𝑆33
𝑆31 𝑆32 𝑆33

𝑆33 𝑆11 𝑆33 𝑆22 𝑆33 𝑆33
⋮ ⋮ ⋮ ⋯
Matriz de varianzas y covarianzas
¡¡¡¡ Lo que debemos recordar … !!!
VARIANZA PARA X VARIANZA PARA Y VARIANZA PARA Z
𝑥𝑖 − 𝑥 2 𝑦𝑖 − 𝑦 2 𝑧−𝑧 2
𝑆𝑋 2 = 𝑆11 2 = 𝑆𝑌 2 = 𝑆22 2 = 𝑆𝑍 2 = 𝑆33 2 =
𝑛−1 𝑛−1 𝑛−1

Covarianza de XY Covarianza de XZ Covarianza YZ

(𝑥𝑖 −𝑥)(𝑦𝑖 − 𝑦) (𝑥𝑖 −𝑥)(𝑧𝑖 − 𝑧) (𝑦𝑖 −𝑌)(𝑧 − 𝑍)


𝑆𝑋𝑌 = 𝑆12 = 𝑆𝑋𝑧 = 𝑆13 = 𝑆𝑌𝑍 = 𝑆23 =
𝑛−1 𝑛−1 𝑛−1
Matriz de varianzas y covarianzas
Ejemplo: Se extrajo una muestra de cinco estudiantes del tercer ciclo de la
escuela de ingeniería de la UTP en los que se les consultó sobre el número
de horas diarias que dedica al estudio, la cantidad de cursos desaprobados
en el ciclo anterior y la edad de dichos estudiantes. Los resultados son los
siguientes:
Variable Alumno
A B C D E
Número de horas de estudio (X) 4 2 2 4 3
Número de cursos desaprobados (Y) 0 2 1 1 1
Edad (Z) 19 24 25 20 22
Se desea determinar el tipo y nivel de correlación entre las variables
tomadas de dos en dos.
Matriz de varianzas y covarianzas
Solución:
Paso 1: Construcción de la tabla de medias:
X Y Y
A 4 0 19
B 2 2 24
C 2 1 25
D 4 1 20
E 3 1 22
Suma 15 5 110
Medias 𝑋=3 𝑌=1 𝑍 = 22
Matriz de varianzas y covarianzas
Paso 2: Tabla de diferencias Paso 3: Cálculo de varianzas
𝑥𝑖 − 𝑋 𝟐 𝑦𝑖 − 𝑌 𝟐 𝑧𝑖 − 𝑍 𝟐
𝑥𝑖 − 𝑋 𝑦𝑖 − 𝑌 𝑧𝑖 − 𝑍 A 1 1 9
1 -1 -3 B 1 1 4
-1 1 2 C 1 0 9
-1 0 3 D 1 0 4
E 0 0 0
1 0 -2
Suma 4 2 26
0 0 0
Var 𝑆𝑋 2 = 1 𝑆𝑌 2 = 0,5 𝑆𝑍 2 = 6,5
Matriz de varianzas y covarianzas
Paso 4.- Tabla de Covarianzas:
Productos de diferencias (cita: tabla 2)
𝑥𝑖 − 𝑋 𝑦𝑖 − 𝑌 𝑥𝑖 − 𝑋 𝑧𝑖 − 𝑍 𝑦𝑖 − 𝑌 𝑧𝑖 − 𝑍
A -1 -3 3
B -1 -2 2
C 0 -3 0
D 0 -2 0
E 0 0 0
Sumas -2 -10 5
Covarianzas 𝑺𝑿𝒀 = 𝑺𝟏𝟐 = −𝟎, 𝟓 𝑺𝑿𝒁 = 𝑺𝟏𝟑 = −𝟐, 𝟓 𝑺𝒀𝒁 = 𝑺𝟐𝟑 = 𝟏, 𝟐𝟓
Matriz de varianzas y covarianzas
Paso 5. Matriz de varianzas y Paso 6. matriz de correlación
covarianzas: (R):

X(1) Y(2) Z(3) X Y Z


X(1) 1 -0,5 -2,5 X 1 -0,7071 -0,9806
Y(2) -0,5 0,5 1,25 Y -0,7071 1 0,6934
Z(3) -2.5 1.25 6,5 Z -0,9806 0,6934 1
Matriz de varianzas y covarianzas

Conclusión 1:
𝑅𝑋𝑌 = 𝑅𝑌𝑋 = −0,7071: La relación entre la variable número de
horas de estudio por día y número de cursos desaprobados es
alta y dado que el coeficiente de correlación es negativo
entonces se establece que es inversa, es decir, que a más horas
de estudio menor será el número de cursos desaprobados.
Sin embargo el coeficiente de determinación es 𝑅𝑋𝑌 2 = 0,5; lo
cual determina que un modelo de regresión lineal para las
estimaciones, con estas dos variables, no es el adecuado.
Matriz de varianzas y covarianzas

Conclusión 2:
𝑅𝑋𝑍 = 𝑅𝑍𝑋 = −0,9806: La relación entre las variables número
de horas de estudio y la edad de los estudiantes es alta e intensa.
Así mismo es inversa, es decir, que a más edad de los estudiantes
menos horas dedican al día para el estudio.
2
El coeficiente de determinación es 𝑅𝑋𝑍 = 0,9616; lo cual
determina que el modelo de regresión lineal para las
estimaciones, con estas dos variables, es el adecuado a un
96,16%.
Matriz de varianzas y covarianzas

Conclusión 3:
𝑅𝑌𝑍 = 𝑅𝑍𝑌 = 0,6934: Este coeficiente muestra la existencia de
una correlación directa con un nivel de moderadamente alto
entre las variables número de cursos desaprobados y la edad de
los estudiantes.
2
Así mismo el coeficiente de determinación es 𝑅𝑌𝑍 = 0,4808.
Esto determina que el modelo de regresión lineal para las
estimaciones, con estas dos variables, no es el adecuado.
Cierre

¿Qué hemos aprendido hoy?

¿Qué utilidad le damos a la construcción


de la matriz de varianzas y covarianzas
en el análisis de Correlación entre
variables?

También podría gustarte