Está en la página 1de 5

EJERCICIOS SOBRE ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

En base a la data CO2 de la librería datasets realiza el análisis de correlación y regresión


lineal en base a los siguientes items asumiendo normalidad: (1 punto cada uno con
interpretación)

Los valores corresponden a niveles de dióxido de carbono en el ambiente (conc) y niveles de


absorción del dióxido de carbono (uptakes)

Análisis de la data “CO2”

i) Variables
Variable dependiente: NIVELES DE ABSORCION DE CO2 (uptakes)
Variable independiente: CO2 EN EL AMBIENTE (conc)

ii) Análisis gráfico

Se observa que hay aparentemente


una asociación lineal directa
moderada entre las variables de co2
en el ambiente y niveles de
absorción.

iii) Coeficiente de correlación


[1] 0.4851774
iv) Validación del coeficiente de correlación
Ho: ρ=0 (No hay correlación a nivel poblacional)
Ha: ρ≠0 (Hay correlación a nivel poblacional)

Pearson's product-moment correlation


data: uptake and conc
t = 5.0245, df = 82, p-value = 2.906e-06
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.3022189 0.6336595
sample estimates:
cor
0.4851774
Como el p valor es menor que 2.906e-06 =0.000000…. y es menor que 0.05 que es el nivel de
significancia, hay evidencia estadística para rechazar Ho, se concluye que HAY CORRELACIÓN A
NIVEL POBLACIONAL.

v) Modelo
Call:
lm(formula = uptake ~ conc, data = CO2)

Coefficients:
(Intercept) conc
19.50029 0.01773
bo=19.50029
b1=0.01773

y=19.50029+0.01773 *x
uptake=19.50029+0.01773 conc
Call:
lm(formula = uptake ~ conc, data = CO2)

Residuals:
Min 1Q Median 3Q Max
-22.831 -7.729 1.483 7.748 16.394

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 19.500290 1.853080 10.523 < 2e-16 ***
conc 0.017731 0.003529 5.024 2.91e-06 ***
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 9.514 on 82 degrees of freedom
Multiple R-squared: 0.2354, Adjusted R-squared: 0.2261
F-statistic: 25.25 on 1 and 82 DF, p-value: 2.906e-06

vi) Validación del modelo


Ho: β1=0 (El modelo no existe)
Ha: β1≠0 (El modelo existe)

Como el p valor del ANOVA es menor que 2.906e-06 (0.0000….) menor que 0.05 que es el nivel
de significancia existe evidencia estadística para rechazar la hipótesis nula. Se concluye que EL
MODELO EXISTE.

vii) Coeficiente de determinación


(cor(uptake,conc,method="pearson"))^2
[1] 0.2353971
Indica que el 23.54% de la variación de los niveles de absorción de co2(y) es explicada por la
variable conc(x)
viii) Pronóstico: Calcula el nivel de absorción de CO2 cuando el nivel de
CO2 en el ambiente es de 600.
predict(model,newdata = new)
1
30.13864
Cuando el nivel del co2 en el ambiente es 600 los niveles de absorción deberían ser 30.13864

ix) Intervalos de confianza para la pendiente e intercepto

x) Intervalo de confianza y de predicción para r


INTERVALO DE CONFIANZA
fit lwr upr

1 30.13864 27.77098 32.50631


Los niveles de co2 varian desde 27.7709 hasta 32.50631

INTERVALO DE PREDICCIÓN

fit lwr upr


1 30.13864 11.06518 49.2121
A través del intervalo de predicción podemos indicar que los niveles de co2 vvariarán desde
11.06518 hasta 49.2121.
xi) Análisis de la independencia de los residuos

Se observa que los residuos son totalmente aleatorios, por lo que el modelo es válido.

xii) Análisis de la normalidad de los residuos

Se observa que hay normalidad en los residuos, por lo que el modelo es válido.

También podría gustarte