Está en la página 1de 4

SESIÓN N° 12

REGRESION LINEAL SIMPLE

1. INTRODUCCIÓN
El objetivo es estudiar la asociación entre dos variables cuantitativas conocida también como
asociación simple, en este texto, sólo en forma descriptiva.
La primera forma del estudio de la asociación entre las variables X e Y es la regresión, que
consiste en determinar una relación funcional (recta de regresión) entre ellas, con el fin de que se
pueda predecir el valor de una variable en base a la otra. La variable que se va predecir se denomina
variable dependiente y la variable que es la base de la predicción se denomina variable
independiente.
La segunda forma del estudio de la asociación entre las variables X e Y, es denominada
correlación, que consiste en determinar la variación conjunta de las dos variables, su grado de
relación, y su sentido (positivo o negativo). La medida del grado de relación se denomina coeficiente
o índice de correlación. El cuadrado del índice de correlación se denomina coeficiente de
determinación.

2. REGRESIÓN LINEAL SIMPLE.


La regresión lineal simple de Y con respecto a X, consiste en determinar la ecuación de la recta:

que mejor se ajuste a los valores de la muestra, con el fin de poder predecir o estimar Y (variable
dependiente) a partir de X (variable independiente).

El proceso de predecir o estimar Y a partir de la variable X, es la regresión. Hallar la función lineal


, consiste en determinar los valores de a y b a partir de los datos de la muestra. Donde
“a” es la constante y “b” la pendiente de la ecuación de la recta lineal.

2.1. Diagrama de dispersión

Definición. Se denomina diagrama de dispersión o nube de puntos, a la gráfica de los valores


( x i , y i ) de las variables X e Y en el sistema cartesiano.

Es frecuentemente posible visualizar el tipo de relación existente entre dos variables a partir del
diagrama de dispersión.

a) lineal positiva b) lineal negativa c) ninguna relación


Fig. 1. Diagramas de dispersión

Por ejemplo, en la figuras 1. a),b) los datos visualizan una relación lineal entre las variables X e Y. En
la figura c) los datos visualizan ninguna relación válida en regresión entre las variables X e Y.
2.1 Recta de regresión de mínimos cuadrados.
La ecuación para la pendiente (b) es:
n ∑ xi y i −∑ x i ∑ y i
b= 2
,
n ∑ x 2i −(∑ x i )

Y para la constante (a) tiene el valor de:

a=
n ( )
∑ y i −b ∑ x i
n

Interpretación del coeficiente de regresión “b”:


El coeficiente “b” es la pendiente o el coeficiente de la regresión lineal. La constante “a” es la
ordenada en el origen.
Si , entonces, la tendencia lineal es creciente, es decir, a mayores valores de X corresponden
mayores valores de Y. También, a menores valores de X corresponden menores valores de Y.
Si , entonces, la tendencia lineal es decreciente, es decir, a mayores valores de X
corresponden menores valores de Y. También, a menores valores de X corresponden mayores
valores de Y.
Si , entonces, . Luego, Y permanece estacionario para cualquier valor de X. En este caso
se dice que, no hay regresión.

NOTA. “b” también se interpreta es el cambio promedio en Y =a+bX cuando X cambia una unidad.
^ i se incrementa en promedio b.
Esto es, si x i se incrementa 1, entonces y

EJEMPLO N° 01:

En un estudio de la relación entre la publicidad por radio y las ventas de un producto, durante 10
semanas se han recopilado los tiempos de duración en minutos de la publicidad por semana ( X), y el
número de artículos vendidos (Y), resultando:
Semana 1 2 3 4 5 6 7 8 9 10
Publicidad X 20 30 30 40 50 60 60 60 70 80
Ventas Y 50 73 69 87 108 128 135 132 148 170
a) Trazar el diagrama de dispersión, e indicar la tendencia.
b) Calcular la recta de regresión de mínimos cuadrados con el fin de predecir las ventas.
c) Estimar la venta si en una semana se hacen 100 minutos de propaganda.
d) Si en la novena semana se incrementara la publicidad en 5 minutos, ¿en cuanto se estima se
incrementen las ventas?.
2. CORRELACION LINEAL SIMPLE.

2.1 Coeficiente o índice de correlación


Definición. El coeficiente de correlación lineal de Pearson de “n” pares de valores
( x 1 , y 1 ),( x 2 , y 2 ), . .. ,( x n , y n ) de una variable bidimensional . Es el número abstracto r que se
calcula por

n ∑ xy −∑ x ∑ y
r=
√ n ∑ x −(∑ x) √n ∑ y −(∑ y )
2 2 2 2

Interpretación:
Si r =1, se dice que hay una correlación perfecta positiva.
Si 0.75< r <1, se dice que hay una correlación fuerte positiva.
Si 0.50< r ≤ 0.75 , se dice que hay una correlación moderada positiva.
Si 0.25< r ≤ 0.50 , se dice que hay una correlación leve positiva.
Si 0.<r < 0.25, se dice que hay una correlación débil positiva.
Si , se dice que no hay correlación entre las dos variables.
Si 0.<r ≤−0.25, se dice que hay una correlación débil negativa.
Si −0.25< r ≤−0.50, se dice que hay una correlación leve negativa.
Si −0.50< r ≤−0.75, se dice que hay una correlación moderada negativa.
Si −0.75 .<r ←1, se dice que hay una correlación fuerte negativa
Si , se dice que hay una correlación perfecta negativa.

2.2 Coeficiente de determinación

El coeficiente de determinación R2 se define como:

R2=( r 2 )∗100

El coeficiente de determinación R 2, es pues una medida de la proximidad del ajuste de la recta de


regresión. Cuanto mayor sea el valor de R2, mejor será el ajuste y más útil la recta de regresión como
instrumento de predicción.
Interpretación: El porcentaje de la variación de la variable dependiente (Y), es explicada por la
variación de la variable independiente (X)

EJEMPLO N° 02: Del ejemplo N° 01, calcular e interpretación el coeficiente de correlación y


determinación.

También podría gustarte