Está en la página 1de 4

Covarianza

Semana 5

Filippo Tassinari

Octubre 26, 2022

Filippo Tassinari Análisis de datos - Semana 5 Octubre 26, 2022 1/4


Distribución condicional y media condicional

Distribución condicional: si x e y son dos variables numéricas, la


distribución condicional de y por x es la distribución de y entre
observaciones con valores especı́ficos de x.

Dependencia entre dos variables: la distribución condicional de una


variable (y) no es la misma para diferentes valores condicionados de la
otra variable (x).

Independencia entre dos variables: la distribución condicional de


una variable (y) es la misma para diferentes valores condicionados de
la otra variable (x).

Dependencia media: la media de y es diferente para diferentes


valores condicionados de x.

Filippo Tassinari Análisis de datos - Semana 5 Octubre 26, 2022 2/4


Covarianza y correlación

La covarianza y la correlación son medidas de dependencia media.

La covarianza y la correlación son muy útiles para comprender la


relación entre dos variables numéricas continuas.

La covarianza indica si ambas variables varı́an en la misma dirección


(covarianza positiva) o en dirección opuesta (covarianza negativa).

En la covarianza importa solo el signo, no su valor numérico:


* valor positivo: ambas variables varı́an en la misma dirección;
* valor negativo: las dos variables varı́an en la dirección opuesta.

Diferentemente, la correlación explica sobre el cambio en una variable,


indica cuánto cambio de proporción en la segunda variable.

Filippo Tassinari Análisis de datos - Semana 5 Octubre 26, 2022 3/4


Covarianza

Covarianza entre x e y:
n
1 X
Sxy = (xi − x̄) (yi − ȳ )
n−1
i=1

Propriedades:
Sólo para 2 variables numéricas;
Solo para asociaciones lineales;
Se ve muy afectada por observaciones atı́picas;
Puede ser positiva o negativa;
Puede tomar cualquier valor.

Filippo Tassinari Análisis de datos - Semana 5 Octubre 26, 2022 4/4

También podría gustarte