Está en la página 1de 15

Taller 10.

Regresión Lineal Simple

Andres Daniel Garcia Martinez

Melissa Babativa Galvis

Andrea Romero Ardila

Prof. Angel David Cujia Benitez

Estadistica 2

Grupo 6

Universidad del Magdalena

Santa Marta

2021
a) Elabore un diagrama de dispersión e indique si es plausible un modelo de regresión
lineal simple.
Podemos observar una relación lineal es plausible debido a que aunque estén muy
dispersos los puntos, estos se encuentran de forma ascendente en una línea recta

b) Escriba el modelo de regresión lineal que permita predecir la producción (Y) en


función de la temperatura (x).

c) Elabore nuevamente un diagrama de dispersión, pero ahora agregue la línea de


tendencia (la recta estimada del modelo)
d) ¿Cuál es la proporción de la variabilidad de Y que puede ser explicada por el
modelo (coeficiente de determinación R 2 )?

La proporcion de variabilidad es de R^2 = 0.466 y R^2 Ajustada = 0.4424 se encuentra


entre los valores de -1 y +1

e) ¿Qué tan buena es la relación entre las variables (coeficiente de correlación R)?
Investigue las escalas en las que se puede clasificar el coeficiente de correlación e
indique para este ejercicio qué grado de relación hay para estas dos variables.

El coeficiente de correlación es de R = 0.6831, y es una correlación positiva fuerte porque


es mayor que 0.50

f) Verifique los supuestos del modelo (linealidad, normalidad de residuos,


homocedasticidad de residuos) e indique si un modelo lineal es el adecuado para
relacionar estas variables.

Normalidad

El P valor es mayor que 0.05, por lo cual no se tiene el criterio suficiente para rechazar la
hipótesis nula entonces los residuos se distribuyen normalmente

Homocedasticidad

El P valor es mayor que 0.05, por lo cual no se tiene el criterio suficiente para rechazar la
hipótesis nula entonces los los errores tienen varianzas homocedásticas

Linealidad

Dado que valor-p=0.000234327 es menor que alfa=0.05 entonces, se rechaza H0 y se


concluye que no existe relación lineal significativa entre las variables
a) Elabore un diagrama de dispersión ¿La relación parece ser lineal?
R// Si, parece un modelo de regresion lineal descendente

b) Escriba el modelo de regresión lineal que permita predecir el Coeficiente de actividad de


c) CrO1,5(Y) en función del Porcentaje Molar (x).

d) Elabore nuevamente un diagrama de dispersión, pero ahora agregue la línea de tendencia


(la recta estimada del modelo)
e) ¿Cuál es la proporción de la variabilidad de Y que puede ser explicada por el modelo
(coeficiente de determinación R 2 )?

La proporción de variabilidad es de R^2 = 0.7853 y R^2 Ajustada = 0.7719 se encuentra


entre los valores de -1 y +1

f) ¿Qué tan buena es la relación entre las variables (coeficiente de correlación R)?

El coeficiente de correlación es de R = -0.88, y es una correlación negativa fuerte porque es


menor que -0.50

g) Verifique los supuestos del modelo (linealidad, normalidad de residuos,


homocedasticidad de residuos) e indique si un modelo lineal es el adecuado para relacionar
estas variables.

Normalidad

El P valor es mayor que 0.05, por lo cual no se tiene el criterio suficiente para rechazar la
hipótesis nula entonces los residuos se distribuyen normalmente

Homocedasticidad

El P valor es mayor que 0.05, por lo cual no se tiene el criterio suficiente para rechazar la
hipótesis nula entonces los los errores tienen varianzas homocedásticas

Linealidad

Dado que valor-p = 9.85x10^-7 es menor que alfa=0.05 entonces, se rechaza H0 y se


concluye que no existe relación lineal significativa entre las variables
h) Elabore un diagrama de dispersión ¿La relación parece ser lineal?
Si, parece un modelo de regresión lineal descendente

i) Escriba el modelo de regresión lineal que permita predecir la VMP (Y) en función de la
distancia escalada (x).

j) Elabore nuevamente un diagrama de dispersión, pero ahora agregue la línea de tendencia


(la recta estimada del modelo)
k) ¿Cuál es la proporción de la variabilidad de Y que puede ser explicada por el modelo
(coeficiente de determinación R 2 )?

La proporción de variabilidad es de R^2 = 0.3295 y R^2 Ajustada = 0.2779 se encuentra


entre los valores de -1 y +1

l) ¿Qué tan buena es la relación entre las variables (coeficiente de correlación R)?

El coeficiente de correlación es de R = -0.574, y es una correlación negativa fuerte porque


es menor que -0.50

m) Verifique los supuestos del modelo (linealidad, normalidad de residuos,


homocedasticidad de residuos) e indique si un modelo lineal es el adecuado para relacionar
estas variables.

Normalidad

El P valor es mayor que 0.05, por lo cual no se tiene el criterio suficiente para rechazar la
hipótesis nula entonces los residuos se distribuyen normalmente

Homocedasticidad

El P valor es mayor que 0.05, por lo cual no se tiene el criterio suficiente para rechazar la
hipótesis nula entonces los los errores tienen varianzas homocedásticas

Linealidad

Dado que valor-p = 9.85x10^-7 es menor que alfa=0.05 entonces, se rechaza H0 y se


concluye que no existe relación lineal significativa entre las variables

n) Repita los pasos anteriores, pero ahora va a trabajar con las variables transformadas.
Haga las siguientes transformaciones logarítmicas de las variables x e y para convertir la
relación en una lineal: Ln(Distancia escalada) y Ln(VMP).
h) Elabore un diagrama de dispersión ¿La relación parece ser lineal?
Conclusión: Podemos observar una relación lineal inversa entre los primeros puntos, pero
con respecto a los últimos puntos la relación no parece comportarse de manera lineal

i) Escriba el modelo de regresión lineal que permita predecir la VMP (Y) en


función de la distancia escalada (x)

𝑉𝑀𝑃 =− 1, 4652 * 𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑖𝑎 𝑒𝑠𝑐𝑎𝑙𝑎𝑑𝑎 + 5. 2783

j) Elabore nuevamente un diagrama de dispersión, pero ahora agregue la línea


de tendencia (la recta estimada del modelo)
k) ¿Cuál es la proporción de la variabilidad de Y que puede ser explicada por el modelo
(coeficiente de determinación R2 )?

Como podemos observar, en la función summary que nos arroja el programa R. la variable
independiente que en este caso es la distancia escalada. Explica en un 67,24% la
variabilidad de la variable dependiente, es decir de el VMP

l) ¿Qué tan buena es la relación entre las variables (coeficiente de correlación R)?

Para hallar el coeficiente de correlación no es más que la raíz cuadrado del R-cuadrado, por
tanto:

𝑅 = 0, 6724 = 0.82 = 82%


El coeficiente de correlación es bastante alto, por lo que podemos decir que existe una
correlación significativa entre el VMP y la distancia escalada

m) Verifique los supuestos del modelo (linealidad, normalidad de residuos,


homocedasticidad de residuos) e indique si un modelo lineal es el adecuado para relacionar
estas variables.

Supuesto de normalidad

Como podemos observar los datos tienden a ajustarse a la línea, por tanto podemos decir
que se cumple el supuesto de normalidad

> El P valor es mayor que 0.05, por lo cual no se tiene el criterio suficiente para rechazar la
hipótesis nula entonces los residuos se distribuyen normalmente

Supuesto de homocedasticidad
Conclusión: Como no se observa algún patrón en los puntos, podemos decir que se cumple
el supuesto de independencia

> El P valor es mayor que 0.05, por lo cual no se tiene el criterio suficiente para rechazar la
hipótesis nula entonces los los errores tienen varianzas homocedásticas

Linealidad

Linealidad

Dado que valor-p = 1.817x10^-4 es menor que alfa=0.05 entonces, se rechaza H0 y se


concluye que no existe relación lineal significativa entre las variables

Conclusión: A pesar de que la correlación lineal de las variables es alta, podemos inferir
por el gráfico de dispersión, dado que los puntos no se ajustan del todo a la línea recta, el
modelo lineal no sería el más adecuado. Puesto que se observa cierta curvatura en los
puntos finales, dando semejanza a un modelo polinómico de grado 2

También podría gustarte