Documentos de Académico
Documentos de Profesional
Documentos de Cultura
REGRESIÓN Y CORRELACIÓN:
Para determinar el grado de correlación entre las variables, no basta con calcular
la varianza explicada, pues existe el coeficiente de determinación o coeficiente de
correlación al cuadrado; sin embargo, frecuentemente se utiliza un coeficiente de
correlación rectilíneo, r siendo este un valor entre -1 y 1.
Si el coeficiente de correlación r es igual o menor que uno, nos indica que tanto la
covarianza, como los coeficientes angulares, son negativos y por tanto la recta
será descendente, por ser la pendiente negativa. Además si es igual a -1, nos
indica que existe una perfecta correlación en otras palabras, cada valor de la
variable deberá ser exactamente igual al estimado, y por tanto la varianza residual
es igual a cero, y la varianza explicada igual a la varianza total.
DIAGRAMA DE DISPERSIÓN
Se trata pues de una dependencia funcional entre las variables. Cuando se trata
de dos variables, una (la X) será la variable independiente mientras que la otra
(la Y) será la variable dependiente. Se habla así de una regresión de Y sobre (o
en función de) X.
Cuando se considera, después de una inspección en la gráfica de dispersión, que
una línea recta es la mejor curva que se ajusta al conjunto de puntos se procede
entonces a emplear el método de la regresión lineal simple. La mejor línea es
aquella que hace mínima la suma de los cuadrados de las diferencias entre los
puntos dados y los obtenidos mediante la línea ajustada o es timada. Es por eso
que a este método también se le conoce como el método de los mínimos
cuadrados. La ecuación de la recta estimada está dada por:
Ejemplo de aplicación:
Si utilizamos:
Tendríamos:
De modo que la ecuación de la recta ajustada está dada por:
Se dice que existe una correlación lineal positiva entre dos variables, si al
aumentar o disminuir los valores de la variable independiente aumentan o
disminuyen los de la variable dependiente. En un gráfico de dispersión, la nube de
puntos tiene forma ascendente y por tanto la recta que se ajusta tendrá una
pendiente positiva. En cambio, cuando al aumentar los valores de la variable
independiente disminuyen los valores de la variable dependiente, o viceversa, se
dice que la correlación lineal es negativa. En este caso la nube de puntos
descenderá de izquierda a derecha y la pendiente de la recta ajustada será
negativa.
Una vez obtenido el error estándar del estimado, es necesario medir qué
porcentaje de la información es recogida o explicada por el modelo de regresión
escogido. Se trata pues, de determinar las variaciones de la variable dependiente
mediante el coeficiente de determinación (R2).
Dónde:
Ejemplo:
Determinar el error estándar de la recta ajustada del ejemplo anterior
REGRESIÓN MÚLTIPLE
Cuando se emplea más de una variable independiente para evaluar una variable
dependiente es conveniente utilizar un método de regresión múltiple, que
consiste en el mismo procedimiento de una regresión lineal simple: describir la
ecuación de regresión, determinar el error de estimación y analizar la correlación
entre las variables.
Dónde:
Dónde:
Ejemplo: