Está en la página 1de 2

CORRELACIÓN Y ECUACIÓN DE REGRESIÓN

La correlación estadística constituye una técnica estadística que nos indica si dos
variables están relacionadas o no. Por ejemplo, considera que las variables son el
ingreso familiar y el gasto familiar. Se sabe que los aumentos de ingresos y gastos
disminuyen juntos. Por lo tanto, están relacionados en el sentido de que el cambio
en cualquier variable estará acompañado por un cambio en la otra variable.

De la misma manera, los precios y la demanda de un producto son variables


relacionadas; cuando los precios aumentan la demanda tenderá a disminuir y
viceversa. Si el cambio en una variable está acompañado de un cambio en la otra,
entonces se dice que las variables están correlacionadas. Por lo tanto, podemos
decir que el ingreso familiar y gastos familiares y el precio y la demanda están
correlacionados.

Relación Entre las Variables


La correlación puede decir algo acerca de la relación entre las variables. Se utiliza
para entender:
 si la relación es positiva o negativa
 la fuerza de la relación.

La correlación es una herramienta poderosa que brinda piezas vitales de


información. En el caso del ingreso familiar y el gasto familiar, es fácil ver que ambos
suben o bajan juntos en la misma dirección. Esto se denomina correlación positiva.
En caso del precio y la demanda, el cambio se produce en la dirección opuesta, de
modo que el aumento de uno está acompañado de un descenso en el otro. Esto se
conoce como correlación negativa.

La ecuación de la recta de regresión

La ecuación de la recta de regresión permite pronosticar la puntuación que


alcanzará cada sujeto en una variable Y conociendo su puntuación en otra variable
X. A la variable Y se le denomina criterio y a la variable X predictor. Sin embargo,
raramente la nube de puntos que representa la relación entre dos variables X e Y
adopta la forma de una línea recta perfecta. En el caso en que exista una relación
alta entre las variables, la nube de puntos tiende a parecerse a una recta. Sólo en
el caso de rxy=1 la nube de puntos se ajusta perfectamente a la línea recta.

Teniendo esto en cuenta, la recta de regresión es la línea recta que mejor se ajusta
a la nube de puntos para dos variables X e Y, es decir, la que permitiría minimizar
el error medio cometido al hacer los pronósticos como si la nube de puntos tuviera
una forma lineal. Por ejemplo: Consideremos un grupo de 4 personas para las que
conocemos sus puntuaciones en determinadas variables X e Y, según se muestra
en las dos primeras columnas de la siguiente tabla:

X Y Y´ Y´-Y (Y´-Y)2
5 3 2 -1 1

6 2 4 2 4

7 4 6 2 4

8 5 8 3 9

A partir de estos valores, y suponiendo que existe una relación lineal entre X e Y,
podemos tratar de pronosticar el valor que alcanzará en la variable Y un sujeto,
conociendo su puntuación en la variable X. Supongamos que la relación existente
entre ambas variables viene determinada por la recta Y = 2X-8. Para comprobar si
esta recta permite realizar un buen pronóstico, comprobaremos si los valores que
toma Y para los cuatro sujetos (según la recta) coinciden con los que efectivamente
hemos observado. Denominamos Y´ a las puntuaciones pronosticadas usando la
recta Y = 2X-8. Así observamos que la puntuación pronosticada para el primer sujeto
es de 2, mientras que la puntuación real obtenida por dicho sujeto ha sido de 3.Se
ha cometido un error en la predicción, que viene determinado por (Y´-Y) (a menudo
interesa que el error no aparezca negativo, es decir, nos da igual que sea por exceso
o por defecto; una forma de evitar el signo es considerando las diferencias al
cuadrado)