Está en la página 1de 2

ANÁLISIS DE CORRELACIÓN

El análisis de correlación consiste en un procedimiento estadístico para


determinar si dos variables están relacionadas o no. El resultado del análisis es
un coeficiente de correlación que puede tomar valores entre -1 y +1. El signo
indica el tipo de correlación entre las dos variables. Un signo positivo indica
que existe una relación positiva entre las dos variables; es decir, cuando la
magnitud de una incrementa, la otra también. Un signo negativo indica que
existe una relación negativa entre las dos variables. Mientras los valores de
una incrementan, los de la segunda variable disminuyen. Si dos variables son
independientes, el coeficiente de correlación es de magnitud cero. La fuerza de
la relación lineal incrementa a medida que el coeficiente de correlación se
aproxima a -1 o a +1.
Ejemplo: Tenemos 4 conjuntos de datos con variables «x» e «y» que tienen
las mismas propiedades estadísticas tradicionales (igual media, varianza,
correlación, línea de regresión, etc.), pero donde las relaciones son bastante
diferentes.
 Conjuntos de datos muy diferentes pueden tener valores de correlación
similares.
 Para no cometer errores de interpretación, debemos tener en cuenta la
curvatura y la presencia de datos atípicos.

- En el primer gráfico observamos una relación lineal, sin outliers, positiva


y bastante fuerte.
- En el segundo la relación no es lineal.
- El tercer conjunto de datos muestra una relación lineal, positiva y muy
fuerte, pero presenta un outlier que puede disminuir su valor de
correlación porque escapa al comportamiento general.
- Y en el último vemos que no existe realmente una relación entre “x” e
“y”, sino que existe un outlier que puede confundir los resultados.
*OUTLIER: una observación dentro de una muestra o una serie temporal
de datos que no es consistente con el resto*

También podría gustarte