Está en la página 1de 14

Correlación lineal

simple
ANÁLISIS DE CORRELACIÓN
Cuando se trabaja con dos variables, pueden surgir diferentes preguntas como:
¿Existe relación entre lo que una empresa gasta en publicidad y el importe de sus ventas?,
¿existe relación entre el número de años de antigüedad en el trabajo y la productividad?, ¿existe
relación entre la edad de un adulto y la presión sistólica?, ¿existe relación entre el contenido de
carbono de una barra de acero y la dureza? Etc.
¿Qué es el análisis de correlación?
Es un grupo de técnicas estadísticas empleado para medir la intensidad de la relación entre dos
variables. La variable que se intenta predecir se denomina variable dependiente (Y) y la variable
utilizada para la predicción es la variable independiente (X); esta variable debe seleccionarse con
cuidado, para que podamos tener cierto nivel de seguridad de que si incide en el
comportamiento de la variable dependiente.

Por ejemplo, si deseamos saber si el nivel de glucosa en la sangre de un varón adulto, tiene
relación con el peso de dicho varón, podemos decir que el peso de los varones, seguramente si
tiene relación o incidencia en el numero de glucosa de la sangre.
¿Qué es un diagrama de dispersión?
Es una gráfica que presenta visualmente la relación entre dos variables de interés de fácil
interpretación.
Como se construye un diagrama de dispersión?
Primero se dibujan los ejes x y Y

En el eje X se marca la escala adecuada para los diferentes valores de la variable independiente.
En el eje Y se marca una escala adecuada para los diferentes valores de la variable dependiente.
Por ultimo se dibuja el conjunto de puntos correspondientes a los pares ordenados o pares
observaciones
Ejemplo
Si tomamos una muestra aleatoria de 10 varones adultos y a cada uno de ellos les medimos el
peso en g y el nivel de glucosa en sangre en mg/100ml, obtenemos los siguientes valores,
designando al peso como la variable independendiente X y al nivel de glucosa en sangre, como
la variable dependiente Y, ya que suponemos que debe existir relación entre dos variables y que
el peso incide en el nivle de glucosa.
Se dibuja el diagrama
Se analiza
Al observar los puntos del diagrama, nos podemos dar una idea de la intensidad de la relación
entre las dos variables, la cual puede ser:
Perfecta, si los puntos están perfectamente alineados sin importar la pendiente o sentido
(positivo o negativo) de la línea, pues la fuerza e la correlación no depende de la dirección;
Fuerte o intensa, cuando los puntos no están alineados pero se encuentran mu juntos en esa
tendencia.
Moderada, cuando no se observa una tendencia clara, pero un acomodo de los puntos mas o
menos definidos.
Débil, cuando no es posible definir una relación entre las dos variables
Nula o espuria, cuando se observa que no hay ninguna relación entre las dos variables.
Coeficiente de Correlación
¿Cómo se denota el coeficiente de correlación? Se denota con r, y puede tomar cualquier valor
entre –1.00 y +1.00. Coeficientes cercanos a -1.00 o a +1.00 indican que existe una correlación
intensa entre las dos variables de interés.
Un coeficiente cercano a cero indica correlación débil, y uno de cero significa que no existe
correlación.
El signo negativo indica que existe una relación inversa, es decir, conforme X aumenta, Y
disminuye. Una correlación positiva indica que si X aumenta, Y también lo hace. El signo no tiene
que ver con la intensidad, r = -0.41 y r = + 0.41 denotan ambos la misma intensidad.
La formula para calcular r es
calcularemos el coeficiente de correlación entre el peso y el nivel de glucosa de los varones
adultos; lo haremos con calculadora paso a paso, pero debemos mencionar que se puede
resolver fácilmente con cualquier paquete de software estadístico
con el valor de n=10, es decir, el número de varones adultos a los que se
les midió el peso y la glucosa y los resultados de la tabla anterior,
aplicamos la fórmula:
Como r resultó de signo positivo, indica que conforme aumenta el peso de los varones adultos, la glucosa
también se incrementa; esta relación podemos decir que tiene un grado de intensidad entre moderado y
fuerte. ¿Existen otros coeficientes que midan la intensidad de relación entre dos variables? Como los términos
débil, moderado y fuerte utilizados para el coeficiente de correlación, no tienen un significado preciso, una
medida que tiene un significado más exacto es el coeficiente de determinación, que se calcula al elevar al
cuadrado el coeficiente de correlación y se denota por r2 . Sólo toma valores entre 0.00 y 1.00 y se puede
expresar en porcentaje con valores entre 0% y 100%. ¿Cómo se define el coeficiente de determinación? El
coeficiente de determinación r2 es la proporción de la variación total en la variable dependiente Y que se
explica por, o se debe a, la variación en la variable dependiente X; también podemos decir que r2 es el
cuadrado de r el coeficiente de correlación
Coeficiente de Correlación
Entonces podemos afirmar que el 65.01% de la variación que se manifiesta en el nivel de
glucosa de los varones, se debe o está explicada por la variación en el peso. Coeficiente de no
determinación Es lógico que el coeficiente de no determinación sea la proporción de la variación
total en Y que no es explicada por la variación en X; se calcula por medio de 1-r2 En nuestro
ejemplo calculamos 1-r2
1-r2= 1-0.6501
=0.3499

Por lo tanto, el 34.99% de la variación de la glucosa, no se explica por la variación en el peso, sino
que se debe a otros factores como puede ser la edad, la altura o los hábitos alimenticios.

También podría gustarte