Está en la página 1de 4

Universidad Católica de Manizales

Laboratorio Virtual R-Software

Análisis de la base de datos sobre la


calidad del aire de Fontibón, Bogotá
evaluado en PM y PM 10 2,5

Juan Diego Hoyos Giraldo


Universidad Católica de Manizales
Facultad de Ingenieria y Arquitectura
Ingenieria Ambiental
Manizales, Caldas.

Resumen Se trabajó con el software R studio para insertar los datos de calidad del aire de Fontibón tales
como: PM 10 (material con tamaño de partícula superior a 10 micras, material con tamaño inferior o igual a
10 micras) y PM 2,5 (material con tamaño de partícula inferior a 2,5 micras) para hacer un análisis de
observación donde a partir de gráficas y boxplots que R studio arrojaba realizar la adecuada intervención
analítica. La conclusión fundamental es que pudimos observar la eficiencia de R studio para el uso de datos
y el posterior estudio de estos a través de gráficas.

I.  INTRODUCCION I. MARCO TEORICO


El presente análisis nos describe cómo se comportan las
variables de : PM 10 (material con tamaño de partícula El objetivo del software es facilitarnos la información sobre
superior a 10 micras, material con tamaño inferior o igual a la calidad del aire de Fontibón, Bogotá medido bajo
10 micras), PM 2,5 (material con tamaño de partícula inferior condiciones de PM 10 (material con tamaño de partícula
a 2,5 micras) en un determinado rango de tiempo. Los datos superior a 10 micras, material con tamaño inferior o igual a
fueron tomados de diferentes estudios realizados para 10 micras) y PM 2,5 (material con tamaño de partícula
definir la calidad del aire específicamente de los factores ya inferior a 2,5 micras).
mencionados. RStudio es un entorno de desarrollo integrado La actividad diaria de la ciudad genera una gran cantidad de
(IDE), dedicado a la computación estadística y gráficos. sustancias que modifican la composición natural del aire
Incluye una consola, editor de sintaxis que apoya la que respiramos tanto en el exterior como en interiores. La
ejecución de código, así como herramientas para el trazado, quema de combustibles fósiles para el transporte y la
la depuración y la gestión del espacio de trabajo. Se generación de energía, tanto a nivel industrial como
definieron algunos códigos para la obtención de los doméstico, produce miles de toneladas de contaminantes
diferentes boxplots donde R arrojaba gráficas para su debido que diariamente se quedan en la atmósfera. Los vehículos
análisis donde se generaban distribuciones normales o no son la principal fuente de emisión de contaminantes del
normales de los datos con la media, mediana, valor del aire, le siguen la industria, los hogares y las emisiones de
primer y tercer cuartil y valor mínimo o máximo. Con la fuentes naturales.
herramienta “main” se hicieron múltiples boxplots para una Para tener conocimiento de la calidad del aire, utilizamos
comparación entre variables o uno diferente para cada mes. un software como lo es R studio donde con una debida
Con la prueba de Shapiro logramos determinar si una programación se pueden hallar datos claves para el análisis
distribución es normal o por el contrario no lo es. de problemas ambientales de interés mediante la
El software R studio permite la realización de operaciones computación estadística y de gráficos.
estadísticas de una manera inmediata, sin embargo, es de Algunos de los códigos más importantes que se utilizó en
crucial importancia instalar los códigos correspondientes y este estudio fueron:
tener un buen manejo de los códigos. “Summary (calidad. Aire)” al correrlo nos despliega los
datos recogidos de la base de datos de la calidad del aire de
Fontibón con sus respectivos análisis por meses y por días.
“boxplot (calidad.aire$...)” nos realiza un gráfico en forma
de cuartiles de los datos que ya hemos ingresado.

Laboratorio Virtual R-Software


1
Análisis de Regresión Lineal Múltiple; R.D. Lara-Escobar

Median, mean, quantile, hist (col= c (rainbow (10))), entre El gráfico de rosa de vientos nos indica que para unos
otros nos arrojan datos fundamnetales de los gráficos como valores iniciales de polución de PM 10 de 2,1 a 16,5 la
la media, la mediana, histogramas, pasteles, etc. dirección de polución se encuentra sesgada hacia el Sureste
Para generar una distribución de los datos con la media y y el Noreste con un radio de frecuencia del viento de hasta
desviación, insertamos las variables a comparar y 15%.
utilizamos el código “…_norm <- rnorm (200, mean=mean Para valores de contaminación de 16,5 a 27,4 la dirección
(…, na.rm=TRUE), sd=sd (…, na.rm=TRUE))”. de polución se dirige hacia el Sureste alcanzando el 10% de
Para generar un múltiple boxplots donde podemos frecuencia de reconteos para la dirección del viento.
comparar las variables se utiliza el código: “boxplot (..., ..., Para valores de polución de 27,4 a 43,6 y de 43,6 a 226 la
.., ..,)” las variables que deseemos comparar separadas por dirección hacia la que se dirigen se encuentra relacionada
comas. por ambas viajan hacia el Suroeste con porcentaje máximo
R studio cuanta con la opción de instalar unos paquetes de de 15%.
datos que nos ayudaran a la hora de realizar alguna
intervención estadística con referente a lo que solicitemos.
De esta manera se obtienen los diferentes resultados
estadísticos y gráficos.

ANALISIS DE DATOS

Boxplots de cada una de las variables en estudio: PM 10 y


PM 2,5

Para el boxplot de la rosa de polución del contaminante


PM 10 se tuvo en cuenta rangos de polución que oscilan
entre 0 – 10; 10 – 20; 20 – 30;…..70 – 225,5; asignándole a
cada uno de estos rangos un color que se torna más intenso
En la anterior ilustración se generó el calendario del si la cantidad de contaminación es mayor. La concentración
de polución mayor está en el Noreste (15%) y en el
polutante PM 10 para la localidad de Fontibon evaluado
Suroeste (10%). De acuerdo a lo anterior se definio que la
para los primeros 6 meses del año con un limite de principal fuente de contaminación se encuentra dirigida
contaminación de 50. Se pudo evidenciar que en los meses hacia el Noreste con valores que oscilan en el rango de 70 a
de Febrero y Marzo se presentaron los mayores niveles de 225,5 de polución.
contaminación, mientras que para el mes de Junio no se
registraron datos por encima del limite establecido. De
acuerdo a lo anterior se puede deduir que la calidad del aire
en cuanto a PM 10 es relativamente buena para la gran
mayoría de estos meses evaluados.

En el boxplot anterior logramos obtener la comparación de


los contaminantes PM 10 (línea gris) y PM 2,5 (línea roja)
durante los meses desde Enero hasta Agosto. En primera
instancia se puede observar que ambos polutantes se
comportan de una manera similar; empiezan ascendiendo
en el nivel normalizado, después ambos descienden y
entran en una fase donde se mantienen relativamente

2 Laboratorio Virtual R-Software


Universidad Católica de Manizales

Laboratorio Virtual R-Software

constantes; sin embargo, es de gran importancia resaltar


que los niveles de PM 2,5 alcanzan un pico más elevado
con una diferencia de hasta 50, lo que quiere decir que
existe mayor presencia de este contaminante generando un
problema mayor para la localidad de Fontibon dado a los
problemas ambientales y de salud que este causa.

En el grafico anterior tenemos el polarplot de PM 10


El anterior grafico polar para el polutante PM 10 en el año
evaluado entre semana y los fines de semana durante el dia
2020 nos indica en que zonas se presenta la mayor
y la noche. Después de realizado un análisis se determinó
concentración de este contamiante. En este caso tenemos
que para los días entre semana y los fines de semana
que los niveles de contaminación mas altos están sesgados
durante el día los puntos donde se presentan mayores
hacia el Suroeste, mientras que los mas bajos están al lado
valores de contaminación son los mismos, sin embargo,
opuesto, hacia el Sureste. Se puede evidenciar de igual
durante los días de la semana en estos puntos se evidencia
manera que alcanzan niveles en la media de hasta 50
una mayor concentración de polución en el Oeste.
identificado por el rango de color. En el Radio del sensor
Para la noche tenemos que los días entre semana se
12 es donde se registran estos niveles de contaminación que
presenta una mayor contaminación que en los fines de
sobrepasan los 50.
semana; en la noche del fin de semana es donde menos
contaminante se evidencia y durante el dia los días entre
semana es donde mayor contaminación se registra.
De acuerdo a lo anterior podemos atribuir esto a los
horarios de trabajo y las horas pico que es donde se
presenta una mayor actividad.

En el anterior boxplot se pudo hacer la comparación de los


picos para los cantaminates PM 10 (línea roja) y PM 2,5

Laboratorio Virtual R-Software


3
Análisis de Regresión Lineal Múltiple; R.D. Lara-Escobar

(línea gris) evaluados en un rango de contaminación de 0 a


200.
Para el PM 10 se pudo determinar que cuenta con una
mayor actividad que el PM 2,5 cuya frecuencia oscila entre
los valore de 0 a 150, pero se presenta un aumento
significativo entre los meses de Junio y Julio alcanzando un
valor por encima de los 200; posteriormente vuelve a tomar
su frecuencia normal.
Para el PM 2,5 se llego a la conclusión de que cuenta con
una menor actividad de contaminación que el PM 10 y
resaltan por encima de su comportamiento normal, 2 picos
que se encuentran entre el rango de meses de Febrero a
Abril alcanzando valores de contaminación de 100.

II. CONCLUSIONES

 El software R Studio es muy útil para analizar


datos estadísticos y graficos de tal forma que se
puedudieron realizar los boxplots para las
variables de PM 10 y PM 2,5 en la localidad de
Fontibon.

 La calidad del aire en cuanto al material


particulado inferior a 2,5 micras se presento
inicialmente en mayor proporción en cuanto al
nivel normalizado.

 La dirección en la que generalmente viajan los


contamiantes y donde se presenta la mayor
concentración de estos se determino que es en el
Suroeste.

4 Laboratorio Virtual R-Software

También podría gustarte