Está en la página 1de 7

TRABAJO DE INTRODUCCIÓN AL R

ALUMNO: Washington Andrés Flores Maza

Estudiante de la Universidad de Cuenca


 Importar a R la base de datos “BD1.xlsx” en el formato adecuado una vez haya sido
revisada y esté en condiciones. Dentro de R nombrar la base de datos como: ejercicio1.
getwd()
[1] "C:/Users/usuario/Documents "
setwd('C:/Users/usuario/Documents/TrabajocursodeR')
Ejercicio1<-read.table("BD1.txt")
 Revisar la estructura de la base de datos de modo que esté seguro que se importaron
correctamente y presentar resúmenes de lso principales estadísticos de todas las variables
“summary” (presentar los resultados y el código).

Ejercicio1$Condition<-factor(Ejercicio1$Condition)
attach(Ejercicio1)

str(Ejercicio1)

'data.frame': 2243 obs. of 13 variables:


$ Alien : int 23 32 25 46 35 89 38 46 40 4 ...
$ Mean.Temperature : num 6.86 7.39 5.3 7.71 7.39 7.36 7.37 7.53 7.12 5.8 ...
$ Mean.Jan.Temperature: num 3.27 3.46 2.29 3.31 2.91 2.83 2.77 3.22 3.07 1.72 ...
$ Rango.de.temperatura: num 4.84 6 3.98 6.46 6.53 6.72 6.79 5.9 5.82 5.88 ...
$ Condition : Factor w/ 3 levels "1","2","3": 2 2 3 2 2 2 2 2 2 2 ...
$ PET : num 518 600 592 607 601 ...
$ Min.pET : num 8.44 13.89 12.98 12.7 11.82 ...
$ Max.pET : num 89.9 101.8 101.5 105.4 105.5 ...
$ Insolation : num 2.79 2.8 3.04 3.28 3.2 ...
$ Growth.Season : num 282 291 205 275 263 ...
$ AET : num 459 484 434 459 451 ...
$ Water.Defcit : num 58.4 115.6 158.1 148.8 150.4 ...
$ Rainfall : num 1392 1605 855 959 958 ...
summary(Ejercicio1)
Alien Mean.Temperature Mean.Jan.Temperature Rango.de.temperatura
Min. : 1.0 Min. : 3.280 Min. :-1.610 Min. :2.040
1st Qu.: 75.5 1st Qu.: 7.260 1st Qu.: 2.310 1st Qu.:6.530
Median :148.0 Median : 8.580 Median : 3.140 Median :7.150
Mean :156.0 Mean : 8.225 Mean : 2.922 Mean :7.008
3rd Qu.:220.0 3rd Qu.: 9.330 3rd Qu.: 3.580 3rd Qu.:7.710
Max. :612.0 Max. :10.840 Max. : 6.710 Max. :9.240

Condition PET Min.pET Max.pET Insolation


1:510 Min. :474.2 Min. : 0.000 Min. : 88.43 Min. :2.188
2:868 1st Qu.:593.6 1st Qu.: 8.890 1st Qu.:104.88 1st Qu.:3.322
3:865 Median :615.9 Median :10.480 Median :108.21 Median :3.653
Mean :608.4 Mean : 9.682 Mean :107.96 Mean :3.622
3rd Qu.:629.3 3rd Qu.:11.630 3rd Qu.:111.28 3rd Qu.:4.003
Max. :660.4 Max. :17.810 Max. :118.64 Max. :5.044
NA's :20
Growth.Season AET Water.Defcit Rainfall
Min. :113.8 Min. :254.4 Min. : 58.44 Min. : 295.2
1st Qu.:244.1 1st Qu.:430.3 1st Qu.:115.02 1st Qu.: 678.5
Median :280.8 Median :452.1 Median :145.53 Median : 855.1
Mean :269.1 Mean :456.2 Mean :152.29 Mean :1037.5
3rd Qu.:297.5 3rd Qu.:483.6 3rd Qu.:186.09 3rd Qu.:1267.3
Max. :352.5 Max. :557.1 Max. :384.27 Max. :3688.9

 Realizar gráficos de histogramas y boxplots para la variable “Main temperature”, revisar


normalidad, colocar las respectivas leyendas (presentar los resultados y el código,
presentar los gráficos en paneles múltiples, incluir leyendas, ejes y distintos colores.)

attach(Ejercicio1)
par(mfcol=c(1,3))->op
hist(Mean.Temperature,col="green", main= "Mean Temperature (Histograma)", xlab="Mean
Temperature", ylab="Frecuencia")
boxplot(Mean.Temperature, col="red", xlab= "Mean Temperature",ylab="y", main= "Mean
Temperature (Boxplot)")
qqnorm(Mean.Temperature, col= "blue", main="Normalidad")
 Establecer un análisis de regresión lineal simple entre las variables: Alien y Mean
temperatura (y = Alien) (adicionar línea de ajuste, presentar los resultados y el código).

> reg.s.1=lm(Alien~Mean.Temperature)
> summary(reg.s.1)

Call:
lm(formula = Alien ~ Mean.Temperature)

Residuals:
Min 1Q Median 3Q Max
-156.96 -43.44 -9.90 32.01 369.12

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -289.372 8.442 -34.28 <2e-16 ***
Mean.Temperature 54.141 1.012 53.50 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 66.91 on 2241 degrees of freedom


Multiple R-squared: 0.5609, Adjusted R-squared: 0.5607
F-statistic: 2863 on 1 and 2241 DF, p-value: < 2.2e-16
plot(Mean.Temperature, Alien, xlab="Mean.Temperature", ylab="Alien")
abbine(reg.s.1)
 Establecer un análisis de regresión lineal múltiple: seleccionar las “mejores variables”.
(presentar los resultados y el código para el “mejor modelo” y definir su ecuación).
r.l.m<-
lm(Alien~Mean.Temperature+Mean.Jan.Temperature+Rango.de.temperatura+PET+Min.pET+Max.pE
T+Insolation+Growth.Season+AET+Water.Defcit+Rainfall)

summary(r.l.m)

Call:
lm(formula = Alien ~ Mean.Temperature + Mean.Jan.Temperature +
Rango.de.temperatura + PET + Min.pET + Max.pET + Insolation +
Growth.Season + AET + Water.Defcit + Rainfall)

Residuals:
Min 1Q Median 3Q Max
-156.931 -35.440 -4.253 26.080 300.327

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -7.776e+02 1.061e+02 -7.326 3.31e-13 ***
Mean.Temperature 3.766e+01 7.831e+00 4.809 1.62e-06 ***
Mean.Jan.Temperature 5.766e+01 6.764e+00 8.525 < 2e-16 ***
Rango.de.temperatura -1.855e+01 2.907e+00 -6.383 2.11e-10 ***
PET -7.895e+00 1.324e+00 -5.965 2.84e-09 ***
Min.pET -2.113e+00 9.053e-01 -2.335 0.019652 *
Max.pET 1.780e+01 1.081e+00 16.460 < 2e-16 ***
Insolation 3.101e+01 6.159e+00 5.036 5.15e-07 ***
Growth.Season -8.353e-01 2.488e-01 -3.357 0.000801 ***
AET 5.905e+00 1.294e+00 4.564 5.29e-06 ***
Water.Defcit 5.952e+00 1.289e+00 4.617 4.12e-06 ***
Rainfall -7.840e-05 4.689e-03 -0.017 0.986660
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 55.26 on 2211 degrees of freedom


(20 observations deleted due to missingness)
Multiple R-squared: 0.7015, Adjusted R-squared: 0.7
F-statistic: 472.4 on 11 and 2211 DF, p-value: < 2.2e-16

Eliminando “Rainfall” R2 cuadrado aumenta indicando que es un major modelo que el anterior
r.l.m<-
lm(Alien~Mean.Temperature+Mean.Jan.Temperature+Rango.de.temperatura+PET+Min.pET+Max.pE
T+Insolation+Growth.Season+AET+Water.Defcit)
summary(r.l.m)
Call:
lm(formula = Alien ~ Mean.Temperature + Mean.Jan.Temperature +
Rango.de.temperatura + PET + Min.pET + Max.pET + Insolation +
Growth.Season + AET + Water.Defcit)

Residuals:
Min 1Q Median 3Q Max
-156.922 -35.448 -4.293 26.079 300.330

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -778.1082 101.9934 -7.629 3.49e-14 ***
Mean.Temperature 37.6559 7.8189 4.816 1.56e-06 ***
Mean.Jan.Temperature 57.6510 6.7402 8.553 < 2e-16 ***
Rango.de.temperatura -18.5502 2.9009 -6.395 1.96e-10 ***
PET -7.8967 1.3183 -5.990 2.44e-09 ***
Min.pET -2.1098 0.8786 -2.401 0.016417 *
Max.pET 17.8042 1.0556 16.867 < 2e-16 ***
Insolation 31.0533 5.6868 5.461 5.28e-08 ***
Growth.Season -0.8353 0.2487 -3.358 0.000798 ***
AET 5.9066 1.2900 4.579 4.94e-06 ***
Water.Defcit 5.9538 1.2838 4.638 3.73e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 55.25 on 2212 degrees of freedom


(20 observations deleted due to missingness)
Multiple R-squared: 0.7015, Adjusted R-squared: 0.7002
F-statistic: 519.8 on 10 and 2212 DF, p-value: < 2.2e-16

 Realizar un análisis de varianza (prueba paramétrica?) para las variables: Alien –


Condition. (presentar los resultados y el código)
varianza<-function(x)sum((x-mean(x))^2)/(length(x)-1)
varianza(Alien)
[1] 10191.24
varianza(Condition)
[1] 0.5882311

anova(lm(Alien~Condition))
Analysis of Variance Table
Response: Alien
Df Sum Sq Mean Sq F value Pr(>F)
Condition 1 1119339 1119339 115.44 < 2.2e-16 ***
Residuals 2241 21729414 9696
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
 Algunas de estas variables pueden estar altamente correlacionadas (suele suceder con
datos climáticos y esto se denomina colinealidad) por lo que convendría hacer un análisis
para verificar esto. (presentar los resultados y el código)
Variables altamente correlacionadas

> cor(Alien,Max.pET)
[1] 0.7148936

> cor(Alien,Insolation)
[1] 0.7441784

> cor(Alien,Mean.Temperature)
[1] 0.7489385

Está variable no presenta correlación como se puede observar en la gráfica

> cor(Alien,Rango.de.temperatura)
[1] 0.4283246

También podría gustarte