Está en la página 1de 3

REGRESION LINEAL SIMPLE SEMANA 8

Diagrama de Dispersin
Un diagrama de dispersin es una grfica de puntos representados en el plano
cartesiano. Cada punto indica un par de valores (x, y). Este diagrama permite observar
cmo se relacionan dos variables; generalmente, lo que se busca al usar un diagrama
de este tipo es determinar si los puntos siguen una lnea recta y si sta tiene pendiente
positiva o negativa.

Anlisis de Correlacin
Los siguientes son los tipos de asociacin lineal que puede haber entre dos variables:
Directa, si la lnea recta es creciente (pendiente positiva).
Inversa, si la lnea recta es decreciente (pendiente negativa).
Inexistente, que es, obviamente, cuando no hay relacin entre las variables
(pendiente igual a cero).

Covarianza ( )
La covarianza es una medida descriptiva que permite determinar el tipo de asociacin
lineal entre dos variables.
Si Sxy es cero, no existe relacin entre las variables.
Si Sxy es negativo, hay una relacin inversa entre las variables. Esto indica que
cuando X aumenta de valor, Y disminuye, y viceversa.
Si Sxy es positivo, hay una relacin directa entre las variables. Esto indica que
cuando el valor de X aumenta, el de Y tambin crece, y viceversa.

Coeficiente de Correlacin
Aunque la covarianza indica el tipo de relacin lineal que hay entre dos variables, no
podemos saber la fortaleza de esa relacin. Para eso debemos calcular otro valor,
llamado coeficiente de correlacin.

1
El coeficiente de correlacin se utiliza para medir la magnitud de la relacin lineal entre
dos variables, es decir, indica cun fuerte o dbil es una relacin lineal. Se denota con
la letra r y tambin se le conoce como r de Pearson, en honor a Karl Pearson. Se
calcula de esta forma:

El rango de valores est entre -1 y +1; los valores intermedios pueden interpretarse, de
forma intuitiva, de esta manera:

Coeficiente de determinacin
Cuando lo que interesa es analizar una relacin de causalidad entre dos variables,
primero debemos definir cul de ellas es la variable Y, variable dependiente, y cul es
la variable X, variable independiente.

2
La variable dependiente Y es la que se busca explicar; en trminos estadsticos, es la
que se busca estimar o pronosticar. A su vez, la variable independiente X es la que
brinda informacin para explicar Y y recibe el nombre de variable de prediccin.
Para saber si una variable X es buena para explicar la variable Y se calcula el
coeficiente de determinacin, que representaremos con r2 y que tiene las
caractersticas siguientes:
Es el cuadrado del coeficiente de correlacin.
Su rango de valores est entre 0 a 1.
No da ninguna informacin sobre la direccin de la relacin entre las variables.
Cuanto ms cerca est de 1, la variable independiente X ser una buena
variable para explicar Y. Es decir, es un factor determinante para Y.
En contraparte, conforme r2 se acerca a 0, indica que X no es un factor
significativo para explicar Y.

Regresin Lineal Simple

En general, el anlisis de regresin se centra en la exploracin, explicacin y estudio


de dependencia de una variable mediante una o ms variables explicativas, de ah el
nombre del mtodo de prediccin basado en este modelo.
En este tema haremos una introduccin al mtodo de regresin lineal simple. Recibe
este nombre, porque:
Regresin: utilizaremos informacin pasada.
Lineal: bajo el supuesto de que entre dos variables (X y Y) existe una relacin
lineal.
Simple: usaremos slo una variable independiente para tratar de explicar la
variable dependiente. En otras palabras, ajustaremos una recta a los datos.
Ajustar se refiere a construir la nica recta que pase lo ms cerca de todos los
puntos ubicados en el diagrama de dispersin.

El mtodo de mnimos cuadrados se usa para determinar la ecuacin de la recta de


regresin, es decir, por medio de l se encuentra la nica recta que pasa lo ms cerca
que se puede de todos los puntos (observaciones) ubicados en un diagrama. La
ecuacin del mtodo de mnimos cuadrados es:
= , + /

También podría gustarte