Está en la página 1de 11

PRACTICA 1

Chirinos Medina Heidy Jacqueline


Kelly wendy castro Garcia
Changping<-
read.csv("https://raw.githubusercontent.com/luiqs/Estadistica-
Aplicada/main/Beijing%20-%20Air%20Quality%20measures/Changping.csv")

Cargando librerias
library(tidyverse)

## -- Attaching packages ---------------------------------------


tidyverse 1.3.1 --

## v ggplot2 3.3.3 v purrr 0.3.4


## v tibble 3.1.0 v dplyr 1.0.5
## v tidyr 1.1.3 v stringr 1.4.0
## v readr 1.4.0 v forcats 0.5.1

## -- Conflicts ------------------------------------------
tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()

library(ggplot2)
library(dplyr)
library(psych)

##
## Attaching package: 'psych'

## The following objects are masked from 'package:ggplot2':


##
## %+%, alpha

# Ejercicios 1
Encuentre la relació n entre la concentració n de material particulado de 2.5
micrometros y la temperatura para el añ o 2013. Utilice tanto grá ficas como
estadísticos para evaluar la relació n, interprete y discuta los resultados.
Changping%>%
filter(year=="2013") %>%
drop_na(TEMP, PM2.5) %>%
ggplot()+
geom_point(aes(x=PM2.5,y=TEMP), colour="blue")+
ggtitle("Relación entre el Material particulado de 2.5 Micrómetros y la
Temperatura")+
xlab("Material Particulado de 2.5 micrómetros")+
ylab("Temperatura")

Changping_2013 <- Changping %>%


filter(year=="2013") %>%
drop_na(TEMP, PM2.5)

correlacion
cor(Changping_2013$PM2.5,Changping_2013$TEMP)

## [1] -0.006154585

Interpretacion
En el grafico se puede observar que el comportamiento de la variable “y” que
corresponde a la temperatura , no depende de los cambios en la variable “x”
corrspondiente al material particulado 2.5 um .Esto se puede evidenciar tabien por el
coeficiente de correlacion , ya que el resultado esta entre un rango de 0- 0.9, es por
ello que no existe relacion entre las variables que se han evaluado.Este mismo
resultado se puede encontrar en el trabajo de COMPARACIÓN DE LA CALIDAD DE
AIRE POR PM10 Y PM 2.5 CON LA TEMPERATURA Y PRECIPITACIONES EN UNA
ZONA ALEDAÑA A LA UNIVERSIDAD LIBRE SEDE BOSQUE EN BOGOTÁ D.C.; donde
de igual manera en esta investigació n n o se encontró ninguna relació n entre esas 2
variables , pero si embargo se puede apreciar que hay concentraciones que
sobrepasan el limite permisible por la OMS.
Ejercicio 2
. Encuentre la relació n entre la concentració n de material particulado de 2.5
micrometros y la precipitacion para el añ o 2014. Utilice tanto grá ficas como
estadísticos para evaluar la relació n interprete y discuta los resultados.
Changping%>%
filter(year=="2014") %>%
drop_na(RAIN, PM2.5) %>%
ggplot()+
geom_point(aes(x=PM2.5,y=TEMP), colour="blue")+
ggtitle("Relación entre el Material particulado de 2.5 Micrómetros y la
Temperatura")+
xlab("Material Particulado de 2.5 micrómetros")+
ylab("Temperatura")

Changping_2014 <- Changping %>%


filter(year=="2014") %>%
drop_na(RAIN, PM2.5)

Correlacion
cor(Changping_2014$PM2.5,Changping_2014$RAIN)

## [1] 0.003028348

Interpretacion
En el grafico se puede observar que el comportamiento de la variable “y” que
corresponde a la precipitacion , no depende de los cambios en la variable “x”
corrspondiente al material particulado 2.5 um .Esto se puede evidenciar tabien por el
coeficiente de correlacion , ya que el resultado esta entre un rango de 0- 0.9, es por
ello que no existe relacion entre las variables que se han evaluado. Este mismo
resultado se puede encontrar en el trabajo de COMPARACIÓN DE LA CALIDAD DE
AIRE POR PM10 Y PM 2.5 CON LA TEMPERATURA Y PRECIPITACIONES EN UNA
ZONA ALEDAÑA A LA UNIVERSIDAD LIBRE SEDE BOSQUE EN BOGOTÁ D.C.; donde
de igual manera en esta investigació n n o se encontró ninguna relació n entre esas 2
variables, pero sim embargo se puede hipotetizar que si debe ver debido a que en la
investigació n se menciona que la concentració n debe disminuir un poco con las
precipitaciones debido al lavado atmosférico .

Ejercicio 3
3. Realice un grá fico de cajas para ver la diferencia entre las concentraciones de
dioxido de azufre (SO2) a lo largo de los 5 añ os de estudio (utilice los añ os
2013, 2014, 2015, 2016, y 2017, como sus variables cualitativas (categorias a
estudiar)). Analice y concluya los diagramas de cajas, su distribució n, la
variabilidad de sus datos o dispersió n para cada añ o, las medidas de posició n
de cada añ o y la prescencia de valores atipicos o “outliers”. Interprete y discuta
los resultados.
Año <- as.character(Changping$year)

SO2_1 <- group_by(Changping, year)

Filtro_1 <- filter(SO2_1, SO2 <= 50, na.rm = TRUE)

ggplot(SO2_1) +
geom_boxplot(mapping = aes(x=Año , y=SO2)) +
ggtitle("Concentracion de Dioxido de Azufre (SO2) entre los años 2013 -
2017")+
xlab("Años") +
ylab("SO2 (ug/m3)")

## Warning: Removed 628 rows containing non-finite values (stat_boxplot).


Changping %>%
select(year, SO2) %>%
group_by(year) %>%
summarise(Distribucion = skew(SO2, na.rm = TRUE, type=3),
Desviacion_estandar = sd(SO2, na.rm = TRUE),
Media = mean(SO2, na.rm = TRUE),
Mediana = median(SO2, na.rm = TRUE),
Coef_variacion = (sd(SO2, na.rm = TRUE)/mean(SO2, na.rm =
TRUE)))

## # A tibble: 5 x 6
## year Distribucion Desviacion_estandar Media Mediana Coef_variacion
## <int> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2013 2.10 22.5 19.3 10.9 1.17
## 2 2014 2.27 28.0 21.1 9 1.33
## 3 2015 3.35 17.4 11.8 4 1.48
## 4 2016 4.64 10.4 8.18 4 1.27
## 5 2017 2.03 14.7 16.4 12 0.893

Interpretacion
La distribució n de los datos es sesgada a la derecha. hay un gran cantidad de valores
atipicos y el mayor esta ebn el añ o 2015. El coeficiente de variació n en los añ os del
2013 - 2016 son mayores a 1.00, lo que se concluye que se puede deber a la cantidad
de datos atipicos que se presenta que el conjunto de datos es extremadamente
heterogéneo. A si mismo si la concentració n de S02 es alta esto puede causar diversos
problemas en la salud, problemas en nuestra salud tales como la irritació n de la nariz,
conjuntivitis, dolor de garganta y lagrimeo, por lo que si fuera un trabajo de
investigació n netamente se podría mandar los datos a la municipalidad afectado para
que tomen algunas medidas, tales por ejemplo sancionar la quema de basura, si por la
zona hay industrias investigarlas si está n siguiendo con los protocolos ambientales
correctos , y con ello tratar de disminuir la concentració n de S02 en la zona de estudio.
Y luego se podría hacer otro monitoreo y ver si la concentració n de SO2 bajo o
aumento.

Ejercicio 4
Compare la desviació n estandar del dioxido de nitrogeno para cada uno de los añ os.
Discuta y evalue el comportamiento de la dispersion de estos datos (Grá fique de ser
necesario para visualizar la variabilidad de los datos evaluados).
Changping%>%
select(year, NO2) %>%
group_by(year) %>%
summarise(Sd_años = sd(NO2, na.rm = TRUE),
Media = mean(NO2, na.rm = TRUE),
Mediana = median(NO2, na.rm = TRUE))

## # A tibble: 5 x 4
## year Sd_años Media Mediana
## <int> <dbl> <dbl> <dbl>
## 1 2013 27.8 41.2 35
## 2 2014 28.4 45.6 38
## 3 2015 30.2 42.8 34
## 4 2016 29.6 45.6 37
## 5 2017 36.9 51.0 42

Changping%>%
select(year, NO2) %>%
group_by(year) %>%
ggplot() +
geom_boxplot(mapping = aes(x = Año, y = NO2)) +
ggtitle("Concentracion de Dioxido de Nitrogeno (NO2) entre los años
2013 - 2017")+
xlab("Años") +
ylab("NO2 (ug/m3)")

## Warning: Removed 667 rows containing non-finite values (stat_boxplot).


Interpretacion
Como se puede observar la desviacion estandar es mayor en el añ o 2017,es por ello
que los valores de No2 estan mas dispersos a comparacion de otros añ os, ademas en
el grafico de cajas y bigotes del añ o 2017 esta mas alargado , a comparacion de los
otros añ os, lo que significa que los datos, cuyos valores son mas altos , van a tener
mayor dispersion, en cambio las diagramas de cjas y bigotes de los otros añ os son
similares , lo cual va a significar que la dispercion es similar . Si ha habido aumento de
la concetracion de este contaminante de seguro es por el uso excesivo de combustibles
fó siles, emisiones de fá bricas y centrales térmicas , como futuros ingenieros
ambientales debemos fiscalizar éticamente para poder encontrar la solució n mas
idó nea y así mejorar la calidad de vida de las personas

Ejercicio 5
Grá fique un histrograma de la concentració n de ozono a los largo de los 4 primeros
añ os de estudio (eliminar el añ o 2017 del estudio). Interprete y discuta los resultados.
Changping%>%
group_by(year) %>%
filter(year != c("2017")) %>%
summarise(Promedio_O3=mean(O3, na.rm=T)) %>%
ggplot(aes(x=year,y=Promedio_O3))+
geom_bar(stat = "identity", colour="red", fill="blue") +
ggtitle("Comparación de la Concentración de Ozono entre los años 2013-
2016")+
xlab("Años")+
ylab("Concentración de Ozono")

Interpretacion
Entre el añ o 2013 y 2014 se registró un aumento de la concentració n promedio de
ozono , luego de ello comenzo a disminuir hasta el añ o 2016. Se señ ala que este es un
contaminante muy perjudicial pues puede irritar las vías respiratorias, causando asi
problemas para respirar y dañ os pulmonares, en la grá fica ha habido una disminució n
se puede hipotetizar a que se puede deber a un uso má s controlado de automó viles
debido a que este es la fuente principal, o que iró nicamente los días que evaluaron no
hubo demasiad luz solar debido que; mayor luz solar + el gases procedentes de
automó viles / chimeneas ,etc = mayor concentració n de ozono en la atmosfera .

Ejercicio 6
Encuentre la relació n entre la concentració n de material particulado de 2.5
micrometros y la concentracion de monoxido de carbono para el añ o 2016 y 2017.
Utilice tanto grá ficas como estadísticos para evaluar la relació n y discuta los
resultados.
"%notin%" <- Negate("%in%")
PM2.5_CO <- Changping %>%
select(year, PM2.5, CO) %>%
filter(year %notin% c("2013", "2014", "2015")) %>%
na.omit(PM2.5 , CO)

PM2.5_CO %>%
ggplot()+
geom_point(aes(x=PM2.5,y=CO), colour="red")+
ggtitle("Relación entre el material particulado de 2.5 micrómetros y la
concentracion de monoxido de carbono (CO)")+
xlab("Material Particulado de 2.5 micrómetros")+
ylab("CO (ug/m3)") +
facet_wrap(~year)

CO_2016 <- PM2.5_CO %>%


select(year, PM2.5, CO) %>%
filter(year %notin% c("2017"))

cor(CO_2016$PM2.5, CO_2016$CO)

## [1] 0.7858258

CO_2017 <- PM2.5_CO %>%


select(year, PM2.5, CO) %>%
filter(year %notin% c("2016"))

cor(CO_2017$PM2.5, CO_2017$CO)

## [1] 0.8611541
Interpretacion
Se puede observar que el comportamiento de la variable Y (monoxido de carbono), si
va a depender de los cambios de la variable X (material particulado de 2.5
micrometros ), con ello se puede conluir que la concentracion de CO va ir aumentando
conforme aunmente el material particulado ,ademas hay puntos que no siguen esta
tendencia pero son insignificantes en comparaciona otros casos. Es por ello que
tambien se puede evidenciarr por los coeficientes de correlacion , para el añ o 2016
0.78, lo cual presenta una relacion lineal significativa y para el 2017 es 0.86 , lo cual
tiene una relacion lineal fuerte. El monó xido de carbono es el resultado de la
combustió n incompleta de los motores de los vehículos, humo de chimeneas, colinas
de cigarro, es por ello que se puede concluir que en la zona de estudio hay mucha
cantidad de automó viles debido a que estos contribuyen aú n má s a la contaminació n
del aire, es por ello que se deben de incentivar el uso de autos eléctricos para que con
ello disminuir la contaminació n, así mismo se debe elaborar un plan junto poniendo
en caso una municipalidad ( de dicho lugar), tratar de primer lugar dar penalidades a
automó viles que liberen gases tó xicos así mismo incentivar a la població n asar
medios de transporte que no contaminen mucho la zona y con ello tratar que la
calidad de aire mejore y con ello disminuir las enfermedades respiratorias y/o
cardiacas .

BIBLIOGRAFIA DE CONSULTA

OMS (2005). Guías de calidad del aire de la OMS relativas al material particulado, el
ozono, el dió xido de nitró geno y el dió xido de azufre. Recuperado de:
https://apps.who.int/iris/bitstream/handle/10665/69478/WHO_SDE_PHE_OEH_06.
02_spa.pdf;jsessionid=733E7C58932396ED2EBFF9345123B0F6?sequence=1

García, M.(s.f.). Concentración de Contaminantes SO2, NO2 y correlación con H+, SO4-2 y
NO3- durante la temporada de lluvias en la Zona Metropolitana de Guadalajara, Jalisco,
México. Recuperado de https://scielo.conicyt.cl/pdf/rcher/v29n2/art04.pdf

Arana, M. (2017). Relación entre monóxido de carbono, material particulado 2,5 con
parámetros ambientales específicos de la ciudad de Cajamarca con las infecciones
respiratorias agudas en niños menores de 5 años, periodo 2013-2015 . Recuperado de

https://repositorio.unc.edu.pe/bitstream/handle/UNC/1437/RELACI%c3%93N
%20ENTRE%20MON%c3%93XIDO%20DE%20CARBONO%2c%20MATERIAL
%20PARTICULADO%202%2c5%20CON%20PAR%c3%81METROS
%20AMBIENTALES%20ESPEC%c3%8dFIC.pdf?sequence=1&isAllowed=y
Altamar Consuegra, A. D. S., Aragó n Moreno, J. A. ., Acosta Nieto, M. F., Rodríguez
Brochero, L. V., & Cuitiva Vallejo, . A. I. . (2019). COMPARACIÓN DE LA CALIDAD DE
AIRE POR PM10 Y PM 2.5 CON LA TEMPERATURA Y PRECIPITACIONES EN UNA ZONA
ALEDAÑA A LA UNIVERSIDAD LIBRE SEDE BOSQUE EN BOGOTÁ D.C. Recuperado de

https://acofipapers.org/index.php/eiei/article/view/247

También podría gustarte