El análisis de correlación consiste en un procedimiento estadístico para
determinar si dos variables están relacionadas o no. El resultado del análisis es un coeficiente de correlación que puede tomar valores entre -1 y +1. El signo indica el tipo de correlación entre las dos variables. Un signo positivo indica que existe una relación positiva entre las dos variables; es decir, cuando la magnitud de una incrementa, la otra también. Un signo negativo indica que existe una relación negativa entre las dos variables. Mientras los valores de una incrementan, los de la segunda variable disminuyen. Si dos variables son independientes, el coeficiente de correlación es de magnitud cero. La fuerza de la relación lineal incrementa a medida que el coeficiente de correlación se aproxima a -1 o a +1. Ejemplo: Tenemos 4 conjuntos de datos con variables «x» e «y» que tienen las mismas propiedades estadísticas tradicionales (igual media, varianza, correlación, línea de regresión, etc.), pero donde las relaciones son bastante diferentes. Conjuntos de datos muy diferentes pueden tener valores de correlación similares. Para no cometer errores de interpretación, debemos tener en cuenta la curvatura y la presencia de datos atípicos.
- En el primer gráfico observamos una relación lineal, sin outliers, positiva
y bastante fuerte. - En el segundo la relación no es lineal. - El tercer conjunto de datos muestra una relación lineal, positiva y muy fuerte, pero presenta un outlier que puede disminuir su valor de correlación porque escapa al comportamiento general. - Y en el último vemos que no existe realmente una relación entre “x” e “y”, sino que existe un outlier que puede confundir los resultados. *OUTLIER: una observación dentro de una muestra o una serie temporal de datos que no es consistente con el resto*
Resumen de Diseño Estadístico Para Investigadores en Ciencias Sociales y del Comportamiento. Capítulo 2: Variables Estadísticas: RESÚMENES UNIVERSITARIOS