Está en la página 1de 4

REGRESION LINEAL SIMPLE

Existen dos formas del estudio de la asociación entre las variables X e Y:

Regresión.- Consiste en determinar una relación funcional (recta de regresión) entre ellas, con la
finalidad de predecir el valor de una variable en base a la otra.

La variable que se va predecir se denomina variable dependiente (Y), y la variable que es la base de
la predicción se denomina variable independiente (X).

Correlación.- Consiste en determinar la variación conjunta de las dos variables, su grado de relación,
y su sentido (positivo o negativo). La medida del grado de relación se denomina coeficiente o índice
de correlación.

El cuadrado del índice de correlación se denomina coeficiente de determinación.

Diagrama de Dispersión
El diagrama de dispersión o nube de puntos, es la gráfica de los valores (xi , yi) de las variables X e
Y en el sistema cartesiano, donde los xi son los valores de la variable

X y los yi son los valores de la variable Y.

Es frecuentemente posible visualizar el tipo de relación existente entre dos variables a partir del
diagrama de dispersión.

Fig. 1 Diagramas de dispersión

Por ejemplo:

1. En las figuras 1.a y 1.b los datos visualizan una relación lineal entre las variables X e Y.

2. En la figura 1.d los datos no visualizan relación valida en regresión entre las variables X e Y.

3. En 1.c hay una relación no lineal.

Mg. Esther Yanet Yanapa Zapana


Covarianza

Es un estadístico que mide el grado de dispersión o variabilidad conjunta de dos variables X e Y con
̅ ,𝒚
respecto a sus medias respectivas (𝒙 ̅).

La covarianza poblacional de n valores es el número Cov(X,Y) o 𝑠𝑋𝑌 que se define como:

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)


𝑠𝑋𝑌 =
𝑛

∑𝑛
𝑖=1 𝑥𝑖 𝑦𝑖
O también 𝑆𝑋𝑌 = − 𝑥̅ 𝑦̅
𝑛

∑𝑛 ̅)
𝑖=1(𝑥𝑖 −𝑥̅ )(𝑦𝑖 −𝑦
La covarianza muestral se define como: 𝑠𝑋𝑌 = 𝑛−1

La covarianza a diferencia de la varianza, puede ser negativa.

Coeficiente o índice de correlación


El coeficiente de correlación lineal de Pearson de n pares de valores (x1 , y1), (x2 , y2), …, (xn , yn) de
una variable bidimensional (X , Y). Es el número abstracto r que se define como:

𝑆𝑋𝑌
𝑟=
𝑆𝑋 𝑆𝑌

Donde,

𝑆𝑋𝑌 es la covarianza de X e Y

𝑆𝑋 es la desviación estándar de X

𝑆𝑦 es la desviación estándar de Y

Luego tenemos:

𝑆𝑋𝑌 𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑟= =
𝑆𝑋 𝑆𝑌 √𝑛 ∑ 𝑥 2 − (∑ 𝑥 )2 ∙ √𝑛 ∑ 𝑦 2 − (∑ 𝑦)2

El coeficiente de correlación r es un número comprendido entre -1 y +1, esto es:

−1 ≤ 𝑟 ≤ 1

Interpretación

Si r = l , se dice que hay una correlación perfecta positiva.

Si r = -1, se dice que hay una correlación perfecta negativa.

Si r = 0, se dice que no hay correlación entre las dos variables.


Mg. Esther Yanet Yanapa Zapana
Valor del coeficiente de correlación Nivel de correlación negativa
0.00 Ninguno
-0.01 – -0.09 Muy débil
-0.10 – -0.29 Débil
-0.30 – -0.59 Moderado
-0.60 – -0.74 Fuerte
-0.75 – -0.99 Muy fuerte
-1 Perfecto
Valor del coeficiente de correlación Nivel de correlación positiva
0.00 Ninguno
0.01 – 0.09 Muy débil
0.10 – 0.29 Débil
0.30 – 0.59 Moderado
0.60 – 0.74 Fuerte
0.75 – 0.99 Muy fuerte
1 Perfecto

Regresión Lineal Simple


Dado n pares de valores (x1 , y1), (x2 , y2), …, (xn , yn) de una variable bidimensional (X , Y). La
regresión lineal simple de Y con respecto a X, consiste en determinar la ecuación de la recta:
Y = a + bX
que mejor se ajuste a los valores de la muestra, con el fin de poder predecir o estimar Y (variable
dependiente) a partir de X (variable independiente).
Usaremos la notación 𝑦̂𝑖 para representar un valor de Y calculado de la ecuación 𝑌 = 𝑎 + 𝑏𝑋
cuando X es igual a xi. Esto es, 𝑦̂𝑖 = a + bxi
Al valor 𝑦̂𝑖 se denomina valor estimado o predecido o ajustado de Y cuando X = xi .
Error o residuo

Es la diferencia entre el valor observado yi y el valor pronosticado 𝑦̂𝑖 :

di = yi – 𝑦̂𝑖

Recta de regresión

Un método para determinar la recta que mejor se ajuste a los n datos de la muestra (xi, yi) es el método
de mínimos cuadrados, de donde se obtiene:

𝑆𝑋𝑌 𝑛 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖 ∑ 𝑥𝑖 𝑦𝑖 − 𝑛 𝑥̅ 𝑦̅
𝑏= = 𝑜 𝑏=
𝑆𝑋2 𝑛 ∑ 𝑥𝑖 2 − (∑ 𝑥𝑖 )2 ∑ 𝑥𝑖 2 − 𝑛𝑥̅ 2

∑ 𝑦𝑖 ∑ 𝑥𝑖
𝑎= −𝑏 𝑜 𝑎 = 𝑦̅ − 𝑏𝑥̅
𝑛 𝑛

Mg. Esther Yanet Yanapa Zapana


Interpretación del coeficiente de regresión b
El coeficiente b es la pendiente o el coeficiente de la regresión lineal.
La constante a es la ordenada en el origen.
⚫ Si b > 0, entonces, la tendencia lineal es creciente, es decir, a mayores valores de X corresponden
mayores valores de Y. También, a menores valores de X corresponden menores valores de Y.
⚫ Si b < 0, entonces, la tendencia lineal es decreciente, es decir, a mayores valores de X
corresponden menores valores de Y. También, a menores valores de X corresponden mayores
valores de Y.
⚫ Si b = 0, entonces, Y = a. Luego, Y permanece estacionario para cualquier valor de X. En este
caso se dice que, no hay regresión.
NOTA.
El coeficiente b también se interpreta como el cambio promedio en 𝑌 = 𝑎 + 𝑏𝑋 cuando X
cambia una unidad. Esto es, si xi se incrementa 1, entonces 𝑦̂𝑖 se incrementa en promedio b.
En general, si xi se incrementa k, entonces 𝑦̂𝑖 , se incrementa en promedio kb.

Ejemplo 1

He aquí los gastos de publicidad (como porcentaje de gastos totales) y los beneficios de operación
netos (como porcentaje de ventas) en una muestra de 10 pequeñas joyerías.

a. Representar los datos en un diagrama de Dispersión.

b. Calcular la Ecuación de Regresión.


c. Pronosticar el valor de 𝑌̂ para cada valor de “𝑋”.
d. Trazar la recta de Regresión.
e. Calcular el coeficiente correlación y de determinación.

Mg. Esther Yanet Yanapa Zapana

También podría gustarte