Está en la página 1de 5

Regresión lineal simple

FORMULAS

SC ( x )=∑ x 2−n x 2

SC ( y )=∑ y −n y
2 2

SP ( xy ) =∑ xy−n x y

SC ( x )=Suma de cuadrados de x
SC ( y )=Suma de cuadrados de y
SP ( xy ) =Suma de productos de xy
ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO

^β 1=b 1= SP( x , y ) ^β 0=b0= y −b1 x


SC ( x)
Por lo tanto, la recta de regresión estimada tiene la siguiente forma:

Y^ =b0 +b1 X

donde:

b 0 : es el intercepto con el eje Y de la recta de regresión.

b 1 : es la pendiente de la recta estimada, llamada coeficiente de regresión el cual se interpreta como el cambio promedio en Y
cuando X cambia en una unidad.

Observación

Si b 1>0, la tendencia lineal es creciente.

Si b 1<0, la tendencia lineal es decreciente.

Si b 1=0, indica que no existe relación lineal entre las variables.

PRUEBA DE HIPÓTESIS PARA VALIDAR LA RECTA DE REGRESIÓN

Paso 1 (Plantee las hipótesis de prueba)

H 0 : β 1=0 (La recta de regresión no es significativa)

H 1 : β1 ≠ 0 (La recta de regresión es significativa)

Paso 2 (Establezca el nivel de significancia) α

Paso 3 (Calcule el valor del estadístico de prueba)


n n n

∑ y 2i −b 0 ∑ y i−b1 ∑ x i y i
i=1 i=1 i =1
Se =
n−2
Se
Sb =
1
√ SC ( X )
b1
T cal=
Sb 1
Paso 4 (Establezca la región de rechazo)

t (α¿¿2 ;n −2 )¿ t (1−α¿¿2 ;n−2)¿

Paso 5 (Concluya de acuerdo al enunciado del problema)

EJERCICIO RESUELTO

Suponga que para hacer un estudio sobre los gastos de consumo familiar mensual en relación con el ingreso familiar mensual, se
eligieron 10 familias al azar encontrándose la siguiente información:

Ingreso familiar ($) ( X ) 80 100 120 140 160 180 200 220 240 260

Gasto de consumo familiar ($) ( Y ) 75 65 90 95 110 115 120 140 155 150

∑ x 2=322000 ∑ x =1700 ∑ y2 =132825 ∑ y=1115 ∑ xy =205900


x=170 y=111.5

SC ( x )=∑ x 2−n x 2=322000−10∗1702 =33000

SC ( y )=∑ y 2 −n y 2=132825−10∗111.52=8502.5

SP ( xy ) =∑ xy−n x y=205900−10∗170∗111.5=16350

a) Calcule la recta de regresión.

Y^ =b0 +b1 X

^β =b = SP(x , y ) = 16350 =0.4955 ^β =b = y−b x=111.5−0.4955∗170=27.2650


1 1 0 0 1
SC ( x) 33000

Y^ =27.2650+ 0.4955 X

b) Es posible afirmar que si el ingreso familiar se incrementa en un dólar, el consumo familiar se incrementa en promedio,
en $ 0.41.

Falso, si el ingreso familiar se incrementa en un dólar, el consumo familiar se incrementa, en promedio, en $ 0.4955.

c) Indique si el modelo puede considerarse significativo.

Paso 1 (Plantee las hipótesis de prueba)

H 0 : β 1=0 (La recta de regresión no es significativa)

H 1 : β1 ≠ 0 (La recta de regresión es significativa)

Paso 2 (Establezca el nivel de significancia) α=0.05


Paso 3 (Calcule el valor del estadístico de prueba)


n n n

∑ y i −b 0 ∑ y i−b1 ∑ x i y i
2

Se =
i=1 i=1
n−2
i =1
=
√ 132825−27.2650∗1115−0.4955∗205900
10−2
=7.0806

Se 7.0806
Sb = = =0.0390
1
√ SC (X ) √33000
b1 0.4955
T cal= = =12.7051
S b 0.0390
1

Paso 4 (Establezca la región de rechazo)

t (α ¿¿2 ;n −2 )=t 0.025; 8 =−2.306 ¿ t (1−α ¿¿2 ;n−2)=t 0.975; 8 =2.306¿

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Tcal=12.7051 y pertenece a la región de rechazo, entonces se rechaza Ho.

Con un nivel de significancia del 5%, existe evidencia estadística para concluir que La recta de regresión es significativa

COEFICIENTE DE CORRELACIÓN DE PEARSON (r )

−1 ≤r ≤ 1
Fórmula para el cálculo del coeficiente de correlación de Pearson:

SP(x , y )
r=
√ SC(x )√ SC( y )

Si r =−1, Indica que la correlación entre las variables X e Y es perfecta negativa.


Si −1<r ≤−0.8 , Correlación negativa intensa
Si −0.8< r ≤−0.2, Correlación negativa normal
Si −0.2<r < 0, Correlación negativa débil
Si 0< r< 0.2, Correlación positiva débil
Si 0.2 ≤ r< 0.8, Correlación positiva normal
Si 0.8 ≤ r <1 , Correlación positiva intensa
Si r =0, Indica que no hay correlación entre las variables X e Y.
Si r =1, Indica que la correlación entre las variables X e Y es perfecta positiva.
COEFICIENTE DE DETERMINACIÓN (R2)
SCReg Variación debido a laregresión
R2= = ; 0 ≤ R2 ≤1
SCT Variación Total

b1 SP ( x , y )
R2=
SC ( y )
Un coeficiente de determinación cercano a uno 1, indica que la recta de regresión estimada se ajusta mejor a los datos.

Para una mejor interpretación del coeficiente de determinación es conveniente convertirlo a porcentaje multiplicando el
resultado por 100%, por lo que, R2 indica el porcentaje de la variabilidad total de Y que es explicada por la recta de regresión
estimada.

EJERCICIO RESUELTO

Suponga que para hacer un estudio sobre los gastos de consumo familiar mensual en relación con el ingreso familiar mensual, se
eligieron 10 familias al azar encontrándose la siguiente información:

Ingreso familiar ($) ( X ) 80 100 120 140 160 180 200 220 240 260

Gasto de consumo familiar ($) ( Y ) 75 65 90 95 110 115 120 140 155 150

a) Explique el significado del coeficiente de correlación de Pearson con respecto al enunciado.

SP( x , y ) 16350
r= = =0.9761
√ SC(x )√ SC( y ) √33000 √ 8502.5
La correlación entre las variables ingreso familiar y gasto de consumo familiar es positiva intensa porque se encuentra entre
0.8 ≤ r <1.

b) Explique el significado del coeficiente de determinación con respecto al enunciado.

2 b1 SP ( x , y ) 0.4955∗16350
R= = =0.9528 95.28 %
SC ( y ) 8502.5
Este valor indica que el 95.28% de la variabilidad del gasto de consumo familiar es explicada por la recta de regresión estimada.

EJERCICIO PROPUESTO

Un corredor de bienes raíces desea saber cómo cambia el precio de una casa ante un cambio en el tamaño de la misma. Por tal
motivo, el corredor seleccionó una muestra aleatoria de 11 casas y obtuvo información sobre la superficie (en 100 m 2) y el precio
(en miles de dólares). Los resultados obtenidos son los siguientes:

Área (X) 1.0 1.4 1.5 1.5 1.3 1.2 1.0 1.6 1.8 1.4 1.2

Precio (Y) 60 69 74 71 68 56 61 76 82 70 65

∑ x 2=20.79 ∑ x =14.9 ∑ y2 =51984 ∑ y=752 ∑ xy =1035.9


x=1.3545 y=68.3636

SC ( x )=∑ x −n x =20.79−11∗1.3545 =0.6086


2 2 2

SC ( y )=∑ y −n y =51984−11∗68.3636 =574.6001


2 2 2

SP ( xy ) =∑ xy−n x y=1035.9−11∗1.3545∗68.3636=17.3165

a) Estime la ecuación de regresión para estimar el precio de una casa a partir de su tamaño.
b) ¿Es el modelo significativo? Utilice un nivel de significancia del 5%.

c) Calcule el error de predicción para una casa cuya área es 140 metros cuadrados.

d) Obtenga el precio esperado de una casa de 165 metros cuadrados.

e) Interprete el coeficiente de regresión en términos del problema.

f) Explique el significado del coeficiente de correlación de Pearson con respecto al enunciado.

g) Explique el significado del coeficiente de determinación con respecto al enunciado.

También podría gustarte