Está en la página 1de 9

Regresión Lineal

Rosa Andrea Correa Ponce

Estadística

Instituto IACC

27 de Septiembre 2021
Desarrollo

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,892117924
Coeficiente de determinación R^2 0,79587439
R^2 ajustado 0,795189405
Error típico 1,054818525
Observaciones 300

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 1292,762648 1292,762648 1161,88541 7,734E-105
Residuos 298 331,5673522 1,112642121
Total 299 1624,33

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción 27,68482137 0,483653796 57,24098845 8,1625E-163 26,73301174 28,63663101 26,7330117 28,63663101
Edad (años) -0,365879673 0,010733877 -34,0864403 7,734E-105 -0,387003477 -0,34475587 -0,3870035 -0,34475587
a)

Grafico de Dispersion:
Edad (años) vs Horas conectado a Internet (semanal)
Horas Conectado a Internet (Semanal)

25

20

15

10

0
15 20 25 30 35 40 45 50 55 60 65
Edad (Años)

Promedio Edad(Años) 44,7


Promedio Horas conectadas (semanal) 11,33
Covarianza -11,77766667
varianza edad (años)| 32,19

El grafico de dispersión nos muestra que los trabajadores entre 20 y 30 años son las que más se

conectan a internet durante la semana. Dada la covarianza negativa, nos indica que hay una

relación inversa donde se refleja que a mayor edad de los trabajadores, es menor la conexión

semanal a internet.
b)

Grafico de Dispersion:
Edad (años) vs Horas conectado a Internet (semanal)

25
Horas Conectado a Internet (Semanal)

f(x) = 47.6044737548469 exp( − 0.0325979660364355 x )


R² = =0.76947756114246
f(x) − 15.1133248365035 ln(x) + 68.6278773305194
20 R² = 0.779414368065134
f(x) = − 0.365879672776224 x + 27.6848213730972
R² = 0.795874389945537
15

10

0
15 20 25 30 35 40 45 50 55 60 65

Edad (Años)

Lineal Modelo Confiable


Exponencial
Logarítmica

En este caso, al comparar los 3 modelos se demuestra que el Modelo de Regresión Lineal

es el modelo más confiable ya que su R^2 es mayor en comparación a los Modelos Exponencial

y Logarítmica. Cabe recordar que el Modelo de Regresión Lineal mide el comportamiento entre

la Variable Dependiente Y que en este caso sería las Horas conectados a Internet y la Variable

Independiente X que en este caso es la Edad (Años).

La interpretación de su pendiente es:

Y= -0,3659X + 27,685
Donde Y= Horas conectados a internet (semanal) y X= Edad (Años)

Por lo tanto:

Horas conectados a Internet = -0,3659 * Edad + 27,685

c) Dato entregado X= 55 años

Y= -0,3659X + 27,685

Y= -0,3659 * 55 + 27,685

Y= 7,5605 horas

Respuesta: Las horas estimadas de conexión a Internet para un trabajador que tiene 55 años es

de 8 horas aproximadamente.

d) Dato entregado: Y= 18 Horas

0,36587967 X = 27,68482137– 15

0,36587967X = 12,68482137

X= 12,68482137 / 0,36587967

X= 34,66938015

Respuesta: La edad estimada de un trabajador que está conectado 15 horas semanales es de 35

años aproximadamente.
e.1)

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,87896342
Coeficiente de determinación R^2 0,7725767
R^2 ajustado 0,77181353
Error típico 89,2710166
Observaciones 300

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 8067590,882 8067590,88 1012,33186 7,73537E-98
Residuos 298 2374855,692 7969,3144
Total 299 10442446,57

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción 118,071273 21,40576039 5,51586444 7,5364E-08 75,94566719 160,196878 75,9456672 160,196878
Antigüedad Laboral (años) 77,4043787 2,432786943 31,817163 7,7354E-98 72,6167598 82,1919976 72,6167598 82,1919976
Sueldo Mensual (miles de $)
1600.0

1400.0

1200.0
Sueldo Mensual (miles de $m)

f(x) = 296.75801519685 exp( 0.109382735654353 x )


R² = 0.809834326556963
f(x) = 77.4043786947093 x + 118.07127261385
1000.0 R² = 0.772576696951059

800.0

600.0

400.0

200.0

0.0
0 2 4 6 8 10 12 14

Antigüedad Laboral (años)

e.2)

Lineal
Modelo
Exponencial
Confiable

El modelo que más se ajusta a los datos estudiados es el Modelo Exponencial ya que su R^2 es

mayor que el modelo Lineal.


e.3) Dato entregado: X= 20 años

Y= 118,071272613849 +77,4043786947094 * X
Y= 118,071272613849 +77,4043786947094 * 20
Y= 1666,158847 (expresado en miles de pesos)

Respuesta: El sueldo estimado para un trabajador que lleva 20 años en la empresa es de


$1.666.159 pesos aproximadamente.

e.4) Dato entregado: Y= $1.100.000 (1100 expresado en miles)

1100 = 118,071272613849 +77,4043786947094 * X


1100 - 118,071272613849 = 77,4043786947094X
981,9287274 = 77,4043786947094X
981,9287274/ 77,4043786947094 = X

X= 12,6857000076

Respuesta: El año de antigüedad estimado para un trabajador que tiene un sueldo mensual de
$1.000.000 pesos es de 13 años app.
Bibliografía

IACC (2018) Regresión Lineal. Estadística. Semana 6.

También podría gustarte