Está en la página 1de 5

Analisis de correlacion lineal

Introducción

La correlación lineal y la regresión lineal simple son métodos estadísticos que


estudian la relación lineal existente entre dos variables. La correlación cuantifica
como de relacionadas están dos variables, mientras que la regresión lineal
consiste en generar una ecuación (modelo) que, basándose en la relación
existente entre ambas variables, permita predecir el valor de una a partir de la
otra.

Por norma general, los estudios de correlación lineal preceden a la generación de


modelos de regresión lineal. Primero se analiza si ambas variables están
correlacionadas y, en caso de estarlo, se procede a generar el modelo de
regresión.

Análisis de Correlación lineal

El análisis de correlación lineal estudia la intensidad y la dirección de la asociación


lineal entre dos variables de naturaleza cuantitativa. Ejemplo: el coeficiente
intelectual y el nivel ingreso de una persona. Relación entre las notas de
Matemáticas y Física.

El proceso para determinar el grado de relación lineal se puede resumir en los


siguientes pasos:

a) Elaboración del diagrama de dispersión


Consiste en la representación en ejes de coordenadas de los puntos
correspondientes a los pares de valores de cada individuo.
Es indiferente qué variable representemos en abscisas y qué variable en
ordenadas. En el análisis de correlación se da una simetría entre las dos
variables.
b) Inspección del diagrama en busca de una relación lineal.
La relación entre dos variables cuantitativas puede ser de naturaleza no
lineal, por ejemplo cuadrática, cúbica, logarítmica, etcétera.
El análisis de correlación lineal sólo debe aplicarse cuando de la inspección
del diagrama de dispersión se pueda deducir la existencia de una relación
lineal.
En caso contrario habrá que proceder a transformaciones en las variables.

c) Cálculo de la covarianza entre las dos variables

La covarianza es una medida del grado en que dos variables cuantitativas


evolucionan paralelamente.
Si las variables toman el mismo crecimiento o decrecimiento entonces,
tendremos una covarianza positiva.
Si las variables toman valores distintos y opuestos entonces, tendremos
una covarianza negativa.
Si las variables una toma un valor determinado (creciente o decreciente) y
la otra valores crecientes o decrecientes entonces, tendremos una
covarianza cercana a cero

d) Cálculo de las desviaciones estándar


Es la raíz cuadrada de la varianza. Es decir, la raíz cuadrada de la media
de los cuadrados de las puntuaciones de desviación. La desviación
estándar se representa por σ.

e) Cálculo del coeficiente de correlación


Es a través de la covarianza y las varianzas de las variables: en el numerador se
ubica la covarianza y en el denominador, la raíz de la multiplicación de las
varianzas.

Coeficiente de correlación

El coeficiente de correlación es la medida específica que cuantifica la intensidad


de la relación lineal entre dos variables en un análisis de correlación. En los
informes de correlación, este coeficiente se simboliza con la r.

La correlación, también conocida como coeficiente de correlación lineal (de


Pearson), es una medida de regresión que pretende cuantificar el grado de
variación conjunta entre dos variables.

Coeficientes de correlación de Pearson

Variables X,Y

Promedios de las variables X, Y

Siendo:
: la covarianza entre el valor «x» e «y».
σ(x): desviación típica de «x».
σ(y): desviación típica de «y».

¿Qué significan los valores del coeficiente de correlación?

El coeficiente de correlación r es un valor sin unidades entre -1 y 1. La


significancia estadística se indica con un valor p. Por lo tanto, usualmente las
correlaciones se escriben con dos números clave: r = y p = .

Valor Significado
-1 Correlación negativa grande y perfecta
Correlación negativa de tendencia muy baja hasta muy
-0,01 a -0,99
alta
0 Correlación nula
0,01 a 0,99 Correlación positiva de tendencia muy baja hasta muy alta
1 Correlación positiva grande y perfecta
El valor p (es una medida de probabilidad empleada para hacer pruebas de
hipótesis) nos ayuda a determinar si podemos o no concluir de manera
significativa que el coeficiente de correlación de la población es diferente a cero,
basándonos en lo que observamos en la muestra.

Error de estimación

Es el valor absoluto de la diferencia entre el valor real y el valor estimado. Sobre la


recta de correlación pudiendo existir valores por encima y (error por exceso) y
valores por debajo (error por defecto)

Error cuadrático de ajuste

Es la sumatoria al cuadrado de la diferencia del valor estimado (Yi) y el promedio.

Ejemplo
Con los datos sobre las temperaturas en dos días diferentes en una ciudad,
determinar el tipo de correlación que existe entre ellas mediante el coeficiente de
PEARSON.

temperaturas
Ciudad A Ciudad B
Días X Y
1 18 13
2 17 15
3 15 14
4 16 13
5 14 9
6 12 10
7 9 8
8 15 13

Solución

Dias X Y Xi-X Yi-Y x2 y2 xy


1 18 13 3,50 1,13 12,25 1,27 3,94
2 17 15 2,50 3,13 6,25 9,77 7,81
3 15 14 0,50 2,13 0,25 4,52 1,06
4 16 13 1,50 1,13 2,25 1,27 1,69
5 14 9 -0,50 -2,88 0,25 8,27 1,44
6 12 10 -2,50 -1,88 6,25 3,52 4,69
7 9 8 -5,50 -3,88 30,25 15,02 21,31
8 15 13 0,50 1,13 0,25 1,27 0,56
Σ 116 95 58,00 44,88 42,50
Promedio 14,50 11,88

Coeficiente de correlación de Pearson

r 0,83

También podría gustarte