Está en la página 1de 8

EC1

Ximena Agama

2022-05-05

1. Activación de paquetes:
Vamos activar el paquete tydiverse
library (tidyverse)

2. Cargamos nuestra base de datos


BD4 <- read.csv("https://raw.githubusercontent.com/luiqs/Estadistica-
Aplicada/main/Beijing%20-%20Air%20Quality%20measures/Dongsi.csv
")

Resolució n de la EC1
Pregunta 1 Encuentre la relació n entre la concentració n de material particulado de 2.5
micrometros y la temperatura para el añ o 2013. Utiliza tanto grá ficas como estadisticos
para evaluar la relació n, interprete y discuta los resultados.
#1 Creamos una nueva variable designada BD42013 y eliminamos los NA
BD42013 <- BD4%>%
filter(year >= 2013L & year <= 2013L) %>%
na.omit(TEMP, PM2.5)

#2 Generamos la grá fica


ggplot(BD42013) +
aes(x = PM2.5, y = TEMP, fill = year) +
geom_point(shape = "circle", size = 1, colour = "pink") +
scale_fill_gradient() +
labs(x = "Material particulado de 2.5 micrometros", y = "Temperatura", title
= "Material particulado de 2.5 micrometros y la temperatura") +
theme_minimal()
#4 Generamos
nuestra intrepertració n La relacion entre la concentració n de material particulado de 2.5
micrometros y la temperatura es inversamente proporcional. Ya que a mayor temperatura ,
menor es la cantidad de pm hasta cierto punto. Como vemos en la grafico, el cambio se hace
notar cuando el pm esta en 0 y la temperaturta oscila entre los 0 a 30°. Si se encuentran
valores atípicos.
#5 Realizamos la correlació n de pearson
cor(BD42013$TEMP, BD42013$PM2.5)

## [1] -0.06741911

Pregunta 2 Encuentre la relació n entre la concentració n de material particulado de 2.5


micrometros y la precipitació n para el añ o 2014.Utlice tanto grá ficas como estadisticas
para evaluar la relació n, interprete y discuta los resultados.
#1 Cargamos nuestra base de datos y activamos paquetes
BD4 <- read.csv("https://raw.githubusercontent.com/luiqs/Estadistica-
Aplicada/main/Beijing%20-%20Air%20Quality%20measures/Dongsi.csv
")
library(dplyr)
library(ggplot2)

#2 Creamos una nueva variable designada BD42014 y eliminamos los NA


BD42014<- BD4%>%
filter(year >= 2014L & year <= 2014L) %>%
na.omit(RAIN, PM2.5)

#3 Generamos el grá fico


ggplot(BD42014) +
aes(x = PM2.5, y = RAIN, fill = year) +
geom_point(shape = "circle", size = 1, colour = "brown") +
scale_fill_gradient() +
labs(x = "Material particulado de 2.5 micrometros", y = "Precipitacion",
title = "Material particulado de 2.5micrometros y la precipitacion") +
theme_minimal() +
theme(legend.position = "none")

#4 Realizamos la interpretació n del grá fico


#5 Correlació n de pearson
cor(BD42014$TEMP, BD42014$PM2.5)

## [1] -0.03784043

3. Realice un grá fico de cajas para ver la diferencia entre las concentraciones de
dió xido de azufre(SO2) a lo largo de los 5 añ os de estudio (utilice los añ os 2013,
2014, 2015, 2016 y 2017,como sus variables cualitativas(categorías a
estudiar))Analiza y concluya los diagramas de cajas, su distribució n, la variabilidad
de sus datos o dispersió n para cada añ o, las medidas de posició n de cada añ o y la
presencia de valores atípicos “outliers”. Interprete y discuta los resultados.
#1 Cargamos nuestra base de datos y activamos paquetes
BD4 <- read.csv("https://raw.githubusercontent.com/luiqs/Estadistica-
Aplicada/main/Beijing%20-%20Air%20Quality%20measures/Dongsi.csv
")
library(dplyr)
library(ggplot2)

#2 Creamos la grá fica


ggplot(BD4)+geom_boxplot(aes(x=as.factor(year), y=SO2), color=" orange
",size= 1.2 )+ xlab("year")+ ggtitle ("Concentraciones de dioxido de azufre
entre 2013-2017")

#3 Realizamos la interpretació n de la grá fica


4. Compare la desviació n estandar del dió xido de nitrogeno para cada uno de los añ os.
Discuta y evalue el comportamiento de la dispersió n de estos datos (Grafique de ser
necesario para visualizar la variabilidad de los datos evaluados).
#1 Cargamos base de datos y activamos paquetes
BD4 <- read.csv("https://raw.githubusercontent.com/luiqs/Estadistica-
Aplicada/main/Beijing%20-%20Air%20Quality%20measures/Dongsi.csv
")
library(dplyr)
library(ggplot2)

#2 Creamos la grá fica


BD4 %>% group_by(year) %>% summarise(sd(NO2, na.rm = T))

## # A tibble: 5 x 2
## year `sd(NO2, na.rm = T)`
## <int> <dbl>
## 1 2013 35.5
## 2 2014 33.0
## 3 2015 32.7
## 4 2016 33.2
## 5 2017 39.3

BD4 %>%
group_by(year) %>%
summarise(NO2_sd = sd(NO2, na.rm = T)) %>%
ggplot(aes(x=year, y=NO2_sd)) + geom_bar(stat="identity", fill="#F266A7",
alpha = 2, size = 1) + ggtitle("Desviacion estandar de NO2 por año") +
xlab("Año")

#3 Hacemos la interpretació n del grá fico


#4 Generamos el grá fico de cajas
BD4 %>%
select(year, NO2) %>%
group_by(year) %>%
ggplot() +
geom_boxplot(mapping = aes(x= as.factor(year)
, y = NO2)) +
ggtitle("Concentracion de dioxido de nitrogeno (NO2) entre 2013 - 2017")+
xlab("Años") +
ylab("NO2 (ug/m3)")

#5 Interpretamos el grá fico


5.Grafique un histrograma de la concentració n de ozono a los largo de los 4 primeros añ os
de estudio (eliminar el añ o 2017 del estudio). Interprete y discuta los resultados.
#1 Insertamos nuestra base de datos y activamos los paquetes
BD4 <- read.csv("https://raw.githubusercontent.com/luiqs/Estadistica-
Aplicada/main/Beijing%20-%20Air%20Quality%20measures/Dongsi.csv
")
library(ggplot2)
library(dplyr)
library(stats)

#2 Generamos una nueva variable


BD4_no_2017 <- BD4 %>%
filter(year !=2017)
#3 Realizamos la grafica
BD4_no_2017 %>%
ggplot()+
geom_histogram(aes(x= O3),color ="green") + ggtitle("Concentración de ozono
desde 2013 - 2016")+
facet_wrap(~year)

#4 Realizamos la interpretació n de grá ficos


6.Encuentre la relació n entre la concentració n de material particulado de 2.5 micrometros
y la concentracion de monoxido de carbo para el añ o 2016 y 2017. Utilice tanto grá ficas
como estadísticos para evaluar la relació n y discuta los resultados.
#1 Cargamos nuestra base datos
BD4 <- read.csv("https://raw.githubusercontent.com/luiqs/Estadistica-
Aplicada/main/Beijing%20-%20Air%20Quality%20measures/Dongsi.csv
")
library(ggplot2)
library(dplyr)
library(stats)

#2 Generamos una nueva variable


BD4<- BD4 %>%
filter(year >= 2016L & year <= 2017L) %>%
na.omit(x = PM2.5,y=CO)
#3 Realizamos la grá fica
ggplot(BD4) +
aes(x = PM2.5, y = CO, fill = year) +
geom_point(shape = "circle", size = 1.5, colour = "orange") +
scale_fill_viridis_c(option = "viridis", direction = 1) +
labs(x = "PM 2.5", y = "CO",title = "Concentracion de Pm 2.5 V.S
Concentracion de CO") + facet_wrap(~year)

#4 Realizamos la interpretació n de los grá ficos


#5 Correlació n de pearson
cor(BD4$CO, BD4$PM2.5)

## [1] 0.8195021

#6 Interpretació n

También podría gustarte