DESARROLLO DE LA ACTIVIDAD
Actividad 1. Mapa Mental
Actividad 2. Definición de Conceptos.
Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:
● Diagrama de dispersión.
El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos asociados de datos
que aparecen en pares (por ejemplo, (x,y), uno de cada conjunto). El diagrama muestra
estos pares como una nube de puntos. Las relaciones entre los conjuntos asociados de
datos se infieren a partir de la forma de las nubes (Hernández, 2017).
Una relación positiva entre x y y significa que los valores crecientes de x están asociados con
los valores crecientes de y.
Una relación negativa significa que los valores crecientes de x están asociados con los valores
decrecientes de y.
Hernández, M. (2017). Diagrama de dispersión [Figura]. Recuperado el 21 de noviembre de:
[Link]
● Correlación lineal simple.
La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es una
medida de regresión que pretende cuantificar el grado de variación conjunta entre dos
variables (Peiro, 2016).
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es
decir, si se representan en un diagrama de dispersión los valores que toman dos variables,
el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos
representados se aproxima a una recta.
De una forma menos coloquial, la podemos definir como el número que mide el grado de
Intensidad y el sentido de la relación entre dos variables.
Siendo:
Cov (x;y): la covarianza entre el valor «x» e «y».
σ(x): desviación típica de «x».
σ(y): desviación típica de «y».
● Coeficiente de determinación R2 (R cuadrado)
El coeficiente de determinación, se define como la proporción de la varianza total de la variable
explicada por la regresión. El coeficiente de determinación, también llamado R
cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar
(López, 2016).
Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1. Cuanto
más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos
intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado estará
el modelo y, por tanto, menos fiable será.
En la expresión anterior tenemos una fracción. Así pues, vayamos por partes. En primer lugar,
analizaremos el numerador, es decir, la parte de arriba.
Para aquellos que no conozcan la expresión de la varianza, les recomiendo que lean el artículo
sobre la misma. Para aquellos que si la conozcan, podrán caer en la cuenta de que es la
expresión de la varianza, pero con dos diferencias fundamentales.
La primera diferencia es que la Y lleva un circunflejo o, lo que los profesores llaman de forma
didáctica, “sombrerito”. Ese sombrerito lo que detalla es que esa Y es la estimación de
un modelo sobre lo que según las variables explicativas vale Y, pero no es el valor real
de Y, sino una estimación de Y.
En segundo lugar, faltaría dividir entre T. Que, en otros casos, se nota como N o número de
observaciones. Sin embargo, dado que la fórmula del denominador también la llevaría,
eliminamos los denominadores (parte de abajo) de ambas fórmulas para simplificar la
expresión. De esta manera es más fácil trabajar con ella.
A continuación, vamos a realizar el mismo análisis con la parte del denominador (parte de
abajo).
En este caso, la única diferencia existente respecto a la fórmula original de la varianza es la
ausencia de su denominador. Es decir, no dividimos entre T o N. Hecho, que ya hemos
aclarado anteriormente.
● Correlación positiva y correlación negativa
Para poder contar con un indicador que nos permita, por un lado, establecer la covariación
conjunta de dos variables, y por otro, que tenga la universalidad suficiente para poder
establecer comparaciones entre distintos casos, se utiliza el coeficiente de correlación
(lineal, de Pearson). La correlación es, pues una medida de covariación conjunta que nos
informa del sentido de esta y de su relevancia, que está acotada y permite la comparación
entre distintos casos (Anónimo. Recuperado el 21 de noviembre de:
[Link]
El coeficiente de correlación entre dos variables puede definirse como la covarianza existente
entre sus dos variables tipificadas y tiene por expresión de cálculo:
Interpretación:
− Si r < 0 Hay correlación negativa: las dos variables se correlacionan en sentido
inverso. A valores altos de una de ellas le suelen corresponder valores bajos de la
otra y viceversa. Cuánto más próximo a -1 esté el coeficiente de correlación más
patente será esta covariación extrema. Si r= -1 hablaremos de correlación negativa
perfecta lo que supone una determinación absoluta entre las dos variables (en
sentido inverso): Existe una relación funcional perfecta entre ambas(una relación
lineal de pendiente negativa).
− Si r > 0 Hay correlación positiva: las dos variables se correlacionan en sentido
directo.A valores altos de una le corresponden valores altos de la otra e igualmente
con los valores bajos. Cuánto más próximo a +1 esté el coeficiente de correlación
más patente será esta covariación. Si r = 1 hablaremos de correlación positiva
perfecta lo que supone una determinación absoluta entre las dos variables (en
sentido directo): Existe una relación lineal perfecta ( con pendiente positiva).
− Si r = 0 se dice que las variables están incorrelacionadas: no puede establecerse
ningún sentido de covariación.
− Propiedad importante: Si dos variables son independientes estarán
incorrelacionadas aunque el resultado recíproco no es necesariamente cierto.
● ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
Según PacoGZ (2008), En la Wikipedia podemos encontrar esta buena explicación de lo
que es la correlación: “La correlación es la medida de asociación entre variables. En
probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación
lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están
correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto
a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación
si al aumentar los valores de A lo hacen también los de B y viceversa.”
El coeficiente de correlación sirve para medir la correlación entre 2 variables. La ventaja
que tiene este coeficiente sobre otras herramientas para medir la correlación, como puede
ser la covarianza, es que los resultados del coeficiente de correlación están acotados entre
-1 y +1. Esta característica nos permite comparar diferentes correlaciones de una manera
más estandarizada.
El coeficiente de correlación se puede calcular con Excel mediante el comando
“[Link]”. También se puede calcular mediante la fórmula:
Siendo Cov (X,Y) la covarianza entre las series temporales X e Y, y σX e σY las
desviaciones estándar de X e Y.
Interpretación
Como he mencionado antes, el coeficiente de correlación tiene un valor acotado entre -
1 y +1. Los valores cercanos a cero indican que no hay asociación entre las variables.
Valores cercanos a uno indican una asociación fuerte, mientras que los valores cercanos
a menos uno indican una asociación fuerte pero inversa.
Por ejemplo, si el coeficiente de correlación entre dos activos financieros es mayor que
0,70, podemos decir que están muy correlacionados positivamente. Por el contrario, si
el valor de este coeficiente está entre -0,20 y +0,20, la correlación será baja. Por último,
si el coeficiente de correlación es menor que -0,70 existirá una gran correlación, pero
negativa.
Referencias Bibliográficas
Hernández, M. (2017). Diagrama de dispersión. Recuperado el 21 de noviembre de:
[Link]
Peiro, A. (2016). Coeficiente de correlación lineal. Recuperado el 21 de noviembre de:
[Link]
López, F. (2016). Coeficiente de determinación (R cuadrado). Recuperado el 21 de
noviembre de: [Link]
[Link]
PacoGZ. (2008). El coeficiente de correlación. Recuperado el 21 de noviembre de:
[Link]