Está en la página 1de 6

Universidad Católica de Manizales

Laboratorio Virtual R-Software

Analisis de la base de datos sobre


polución de PM y PM en Londres para el
10 2,5

año 2000
Juan Diego Hoyos Giraldo
Universidad Católica de Manizales
Facultad de Ingenieria y Arquitectura
Ingenieria Ambiental
Manizales, Caldas.

Resumen Se trabajo con el software R studio para insertar los datos sobre la polución en Londres en cuanto
a material particulado con tamaño de partícula inferior o igual a 10 micras ( PM 10 ) y material con tamaño de
partícula inferior a 2,5 micras ( PM 2,5) durante el año 2000 para hacer un análisis de observación de graficas
donde a partir de boxplots que R studio arrojaba realizar la adecuada intervención analítica. La conclusión
fundamental es que pudimos observar la eficiencia de R studio para el uso de datos y el posterior estudio de
estos a través de graficas.

I.  INTRODUCCION II. MARCO TEORICO


El presente análisis nos describe datos sobre la El objetivo del software es facilitarnos la información sobre
polución en Londres y cómo se comportan las la calidad del aire en Londres medido bajo condiciones de
variables de : PM 10 (material con tamaño de partícula PM 10 y PM 2,5.
superior a 10 micras, material con tamaño inferior o La actividad diaria de la ciudad genera una gran cantidad de
igual a 10 micras) y PM 2,5 (material con tamaño de sustancias que modifican la composición natural del aire
partícula inferior a 2,5 micras) durante el año 2000. Los que respiramos tanto en el exterior como en interiores. La
datos fueron tomados de diferentes estudios realizados quema de combustibles fósiles para el transporte y la
para definir la calidad del aire específicamente de los generación de energía, tanto a nivel industrial como
factores ya mencionados. RStudio es un entorno de doméstico, produce miles de toneladas de contaminantes
desarrollo integrado (IDE), dedicado a la computación que diariamente se quedan en la atmósfera. Los vehículos
estadística y gráficos. Incluye una consola, editor de son la principal fuente de emisión de contaminantes del
sintaxis que apoya la ejecución de código, así como aire, le siguen la industria, los hogares y las emisiones de
herramientas para el trazado, la depuración y la gestión fuentes naturales.
del espacio de trabajo. Se definieron algunos códigos Para tener conocimiento de la calidad del aire, utilizamos
para la obtención de los diferentes boxplots donde R un software como lo es R studio donde con una debida
arrojaba gráficas para su debido análisis donde se programación se pueden hallar datos claves para el análisis
generaban distribuciones normales o no normales de los de problemas ambientales de interés mediante la
datos con su respectivo limite permitico por la entidad computación estadística y de gráficos.
ambiental allí gobernate. Con la herramienta Algunos de los códigos más importantes que se utilizó en
este estudio fueron:
“SummaryPlot” se hicieron múltiples boxplots para una
“head(mydata)” al correrlo nos despliega los datos
comparación entre variables o específicamente para cada
recogidos en la base de datos sobre polución en Londres
una. El software R studio permite la realización de
entre 1998 – 2005.
operaciones estadísticas de una manera inmediata, sin “summaryPlot(select(dat2000, date:…))” nos realiza un
embargo, es de crucial importancia instalar los códigos gráfico de una variable en especifico con su diagrama de
correspondientes y tener un buen manejo de los códigos. barras.
“windRose(mydata, type = "…", layout = c(4, 1))” genera
la rosa de vientos fundamental para determiner en que
dirección viajan los contaminantes estudiados.

Laboratorio Virtual R-Software


1
Análisis de Regresión Lineal Múltiple; R.D. Lara-Escobar

“pollutionRose(data2000, pollutant = "…")” crea la rosa de A partir del grafico de la rosa de vientos para PM 10
polución. durante el año 2000 se pudo establecer que el polutante
Datos como series de tiempo, tendencias, relaciones entre toma una dirección inicial hacia el Noroeste con una media
polutantes, entre otros; al generar su correspondiente de 4,373 y una frecuencia de conteo por dirección del vieno
código arrojan los boxplots fundamentales a la hora realizar entre 0% y 15%; posterior a esto la dirección del viento
la parte analítica.
cambia para valores de PM 10 de 22 a 801 tomando un
R studio cuanta con la opción de intalar unos paquetes de
datos que nos ayudaran a la hora de realizar alguna nuevo rumbo hacia el Suroeste y posicionándose con una
intervención estadística con referente a lo que solicitemos. frecuencia de conteo por dirección del viento entre 0% y
De esta manera se obtienen los diferentes resultados 25%
estadísticos y gráficos.
Rosa de polución.
ANALISIS DE DATOS

A continuación, se presentan los boxplots generados para


las variables en estudio durante el año 2000.

Material particulado de 10 micras ( PM 10 ) año 2000.

Calendario – Límite 50.

Para el boxplot de la rosa de polución del contaminante


PM 10 se tuvo en cuenta rangos de polución que oscilan
entre 0 – 10; 10 – 20; 20 – 30;…..70 – 693; asignándole a
cada uno de estos rangos un color que se torna más intenso
si la cantidad de contaminación es mayor. La concentración
de polución está en el Suroeste lo que corrobora el boxplot
En la anterior ilustración se generó el calendario del de la rosa de vientos y de igual manera la frecuencia de
polutante PM 10 durante el año 2000 evaluado por meses conteo por dirección del viento establecida entre 0 y 21%.
con un limite de contaminación de 50. Se pudo evidenciar
que en los meses de Enero, Marzo y Junio se presentaron Percentil – Rosa de polución.
los mayores niveles de contaminación, mientras que para
los meses de Abril y Diciembre se registraron los niveles
más bajos para la ciudad. De acuerdo a lo anterior podemos
deducir que la curva de polución se encuentra sesgada hacia
la izquierda entre los primeros meses del año.

Rosa de vientos.

2 Laboratorio Virtual R-Software


Universidad Católica de Manizales

Laboratorio Virtual R-Software

que la cantidad de polución llega al punto limite de la


escala generada para evaluar este percentil.

Serie de tiempo.

Teniendo en cuenta el anterior boxplot que expone una


serie de tiempo donde se evalúan los niveles máximos de
contaminación por parte de PM 10 en una escala de: bajo
(color verde), medio (color amarillo) y alto (color rojo) para
el año 2000 en unas respectivas horas del día. Al realizar el
De acuerdo al percentil en forma de rosa de polución se analisis se puede determinar que existe una relación en las
pudo analizar entre que rangos de material particulado se horas; entre las 6 de la mañana y las 4 de la tarde se
encuentra la mayor concentración de este y la dirección presentan los mayores registros de polución para la ciudad,
cardinal que se le atribuye; los datos que más se registraron siendo los meses de Enero y Marzo los más críticos y por el
son atrbuidos al Suroeste y Sureste, se alcanzaron valores contrario el mes de Diciembre cuenta con las cifras mas
de material particulado PM 10 mayores a 80 ubicados en un bajas de contaminación.
rango morado que pertenece al percentil entre 90 y 95.
Relación entre polutantes.
Percentil polar.

En la anterior grafica se plasma la relación entre los


polutantes PM 10 (eje X) y PM 2,5 (eje Y) evaluados en un
rango que oscila entre 1 como valor mínimo y 1992 como
Se generó un percentil polar relacionado con un mapa de el valor máximo registrado. Se establació que pueden
calor donde aumneta su intensidad de acuerdo a la cantidad cumplir con una tendencia lineal, sin embargo, es de gran
de contaminación que haya en una zona determinada. Para importancia recalcar que la contaminación por PM 10 es
la anterior se pudo establecer que la polución de PM 10 se mayor que la registrada para el polutante PM 2,5, pero
direge en dirección Suroeste, mientras que hacia el Norte se ambas coinciden cuando se presenta la mayor
encuentran muy bajos niveles. Entre 0 y 10ws encontramos

Laboratorio Virtual R-Software


3
Análisis de Regresión Lineal Múltiple; R.D. Lara-Escobar

concentración de estos en los puntos entre 0 y 100 para un donde el contaminante sobrepaso el limite establecido,
valor contaminante de 1992 en la ciudad de Londres. mientras que para el resto de meses no se registraron
niveles de PM 2,5 para la ciudad. De acuerdo a lo anterior
podemos deducir que en el mes de Marzo se presenta la
mayor cantidad de datos registrados sobre ambos polutantes
que exceden el límite.

Rosa de vientos.

En el anterior boxplot se pudo hacer la comparación de los


picos para los cantaminates PM 10 (línea roja) y PM 2,5
(línea gris) evaluados en un rango de contaminación de 0 a
600. En la grafica anterior se generó la frecuencia de los
Para el PM 10 se pudo determinar que cuenta con 6 picos reconteos por dirección del viento para el PM 2,5 durante el
significativos cuya frecuencia oscila entre los valore de 0 a año 2000. Se evidencio que para un valor de
200, pero se presenta un aumento significativo entre los contaminación de 0 a 13 la dirección del viento está
meses de Julio a Octubre alcanzando un valor por encima dirigida hacia Noroeste en su mayoría con un porcentaje de
de los 600; posteriormente vuelve a tomar su frecuencia hasta 15%. Para valores de contaminación de 13 a 20 la
normal. dirección del viento varia en este caso hacia el Suroeste en
Para el PM 2,5 se llego a la conclusión de que cuenta con 4 su gran mayoría con porcentajes que oscilan entre 0% y
picos de contaminación que resaltan por encima de su 15%. Para valores de polutante de 20 a 28 y de 28 a 398 la
comportamiento normal, 3 de ellos se encuentran entre el dirección del viento continua con la tendencia dirigiéndose
rango de meses de Enero a Abril y el último al igual que el hacia el Suroeste, pero esta vez con porcentajes de
PM 10 se encuentran estrechamente relacionados ya que se frecuencia de hasta 22%
presenta un gran aumento de polución durante los meses de
Julio a Octubre alcanzando valores cercanos a los 400.

Material particulado de 2,5 micras ( PM 2,5) año 2000. Rosa de polución.

Calendario – Límite 50.

De acuerdo al boxplot para la rosa de polución se determinó


En el boxplot generado anteriormente se realizó el que la concentración del polutante PM 2,5 se encuentra en
calendario del polutante PM 2,5 durante el año 2000 el Suroeste alcanzando registros de hasta el 20% en la
frecuencia de reconteos por dirección del viento y niveles
evaluado por meses con un limite de contaminación de 50.
de contaminación que varian de 50 a 330, siendo este el
Se pudo evidenciar que en los meses de Enero, Marzo,
mayor rango presentado. La media se estableció en 25,906.
Junio, Septiembre y Diciemre se presentaron los casos

4 Laboratorio Virtual R-Software


Universidad Católica de Manizales

Laboratorio Virtual R-Software

Percentil – Rosa de polución.

Se logra identificar en el percentil polar que la mayor


concentración de contaminación del PM 2,5 se encuentra
distribuida en su mayoría hacia el Suroeste con otros puntos
críticos hacia el Noreste. Se establecen radios de sensores
del viento que arrojan como resultado la cantidad de
En la ilustración anterior se pueden apreciar los percentiles
contaminante en ciertas zonas, para este caso evaluados en
para la rosa de polución del PM 2,5 evaluado en rangos de 0 valores de 0 a 35 definiendo así lo anteriormente planteado
a 60 y percentiles de 0-25; 25-50; 50-75; 75-90 y 90-95. para los puntos donde se presenta gran cantidad de este
Para el percentil 0-25: se encuentra en un rango de contaminante.
contaminación entre 0 y 10 en su mayoría, pero con valores
anormales que llegan hasta 22. Serie de tiempo.
Para el percentil 25-50: su rango de contaminación se
encuentra entre 10 y 30.
Para el percentil 50-75: su rango de contaminación está
definido entre los 20 y 40.
Para el percentil 90-95: siendo este la cantidad mayor de
contaminación alcanzando valores de hasta casi 60 desde el
centro de esta rosa de polución.
Con este tipo de graficas se puede establecer que tanto
alcance tiene un contamiante trazando diferentes radios y
asignandole a cada uno un valor.
De acuerdo al boxplot anterior que representa una serie de
Percentil polar tiempo por meses para el año 2000 se pudo interpretar que
los meses Febrero, Septiembre y Noviembre son los que
presentan mayores emiciones de contaminante mientras que
para los meses faltantes las emiciones de PM 2,5 se
mantienen en un rago medio – bajo. Las horas en las que se
presentan los mayores niveles de polución oscilan entre las
7 de la mañana y las 2 de la tarde, siendo las 10 de la noche
un dato anormal presentando un gran registro del polutante.

III. CONCLUSIONES

 El software R Studio es muy útil para analizar


datos estadísticos y graficos de tal forma que se

Laboratorio Virtual R-Software


5
Análisis de Regresión Lineal Múltiple; R.D. Lara-Escobar

puedudieron realizar los boxplots para las


variables de PM 10 y PM 2,5 en el año 2000.

 La calidad del aire en cuanto al material


particulado inferior a 2,5 micras se presento en
pequeñas cantidades en comparación al de 10
micras que tuvo datos significativos.

 La dirección en la que generalmente viajan los


contaminantes se detrmino que es hacia el sur-
Oeste teniendo en cuenta la rosa de vientos.

 En los meses de Abril, Mayo, Agosto y Diciembre


se presentan los menores niveles de
contaminación.

IV. BIBLIOGRAFIA

 BBC. (2019, 21 noviembre). Por qué está


aumentando la velocidad de los vientos en la
Tierra (y cómo nos puede afectar). BBC News
Mundo. https://www.bbc.com/mundo/noticias-
50489716#:%7E:text=%22La%20causa
%20principal%20del%20aumento,mixto%20del
%20Consejo%20Superior%20de

 RStudio. (2020, 15 de marzo). Wikipedia,


La enciclopedia libre. Fecha de consulta:
09:03, septiembre 10, 2020
desde https://es.wikipedia.org/w/index.php?
title=RStudio&oldid=124283164.

 S&P. (2019, 27 mayo). Índice de calidad del aire:


cómo medir la calidad del aire residencial | S&P.
S&P Sistemas de Ventilación.
https://www.solerpalau.com/es-es/blog/indice-
calidad-aire/#:%7E:text=El%20valor%20del
%20%C3%ADndice%20de,ICA%20de%200%20a
%2050)

 RStudio Cloud - Do, share, teach, and learn data


science. (s. f.). RStudio.cloud. Recuperado 10 de
septiembre de 2020, de
https://rstudio.cloud/projects

6 Laboratorio Virtual R-Software

También podría gustarte