Está en la página 1de 3

Covarianza

La covarianza entre dos variables es un estadístico resumen indicador de si las


puntuaciones están relacionadas entre sí. La formulación clásica, se simboliza por la
letra griega sigma (\sigma_{xy}) cuando ha sido calculada en la población. Si se
obtiene sobre una muestra, se designa por la letra "s_{xy}".

La formula suele aparecer expresada como:

Este tipo de estadístico puede utilizarse para medir el grado de relación de dos variables
si ambas utilizan una escala de medida a nivel de intervalo/razón (variables
cuantitativas).

La expresión se resuelve promediando el producto de las puntuaciones diferenciales por


su tamaño muestral (n pares de puntuaciones, n-1 en su forma insesgada). Este
estadístico, refleja la relación lineal que existe entre dos variables. El resultado
numérico fluctua entre los rangos de +infinito a -infinito. Al no tener unos límites
establecidos no puede determinarse el grado de relación lineal que existe entre las dos
variables, solo es posible ver la tendencia.

Coeficiente de Correlación de Pearson [editar]


El coeficiente de correlación de Pearson, r, nos permite saber si el ajuste de la nube de
puntos a la recta de regresión obtenida es satisfactorio. Se define como el cociente entre
la covarianza y el producto de las desviaciones típicas (raíz cuadrada de las varianzas).

Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante


cualquiera de las dos expresiones siguientes:
Propìedades [editar]

• El coeficiente de correlación, r, presenta valores entre –1 y +1.


• Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube
de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar
una recta de regresión.
• Cuando r es cercano a +1, hay una buena correlación positiva entre las variables
según un modelo lineal y la recta de regresión que se determine tendrá pendiente
positiva, será creciente.
• Cuando r es cercano a -1, hay una buena correlación negativa entre las variables
según un modelo lineal y la recta de regresión que se determine tendrá pendiente
negativa: es decreciente.

Varianza = La varianza es una variable estadística que mide la dispersión de los valores
respecto a un valor central (media), es decir, la media de las diferencias cuadráticas del
las puntuaciones respecto a su media aritmética.

Propiedades=

• La varianza es siempre positiva o 0:


• Si a los datos de la distribución les sumamos una cantidad constante la varianza
no se modifica.

Yi = Xi + k
• Si a los datos de la distribución les multiplicamos una constante, la varianza
queda multiplicada por el cuadrado de esa constante.

• Propiedad distributiva: V(X + Y) = V(X) + V(Y)

Las anteriores imágenes muestran como se puede utilizar un programa informático


como Scilab para calcular la varianza.

Para comenzar hay que introducir los datos en un vector o matriz de la forma:
Nombre_variable=[ datos separados por espacios ]. Una vez introducidos los datos, se
calcula la varianza con el comando: variance(nombre_variable)

También podría gustarte