La primera forma de describir una distribución bivariante es representar
los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.
Un diagrama de dispersión es una representación gráfica de la relación
entre dos variables, muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos.
Correlación lineal simple:
Si entre dos variables cuantitativas existe una relación lineal, el análisis de correlación lineal simple se usa para determinar la dirección y magnitud de dicha relación.
Coeficiente de determinación R2: El coeficiente de determinación, se
define como la proporción de la varianza total de la variable explicada por la regresión. El coeficiente de determinación, también llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar. Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por tanto, menos fiable será. En la expresión anterior tenemos una fracción. Así pues, vayamos por partes. En primer lugar, analizaremos el numerador, es decir, la parte de arriba.
Correlación positiva y correlación negativa
Correlación Positiva. Ocurre cuando al crecer (o decrecer) una de
las variables, la otra también crece (o decrece). Por ejemplo: a medida que se eleva el nivel de vida de una población, tiende a aumentar el consumo de artículos que no son de primera necesidad.
Correlación Negativa. Ocurre cuando al crecer alguna de las
variables, la otra decrece o viceversa. Por ejemplo: a medida que se amplían los sistemas de salubridad y medicina preventiva, decrece el índice de mortalidad de las enfermedades infectocontagiosas.
¿Qué es el coeficiente de correlación lineal y qué nos ayuda a
medir?: La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos variables. Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es decir, si se representan en un diagrama de dispersión los valores que toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos representados se aproxima a una recta.
De una forma menos coloquial, la podemos definir como el número que
mide el grado de intensidad y el sentido de la relación entre dos variables.