Está en la página 1de 12

Comunicación Técnica

Eficacia de un modelo de predicción de los niveles


horarios de ozono en la
estación de Muskiz

Autor principal: Elena Aguirre Basurko

Institución: Universidad del País Vasco. Escuela Universitaria de Ingeniería Técnica


Industrial. Dpto de Matemática Aplicada
Teléfono: 94 6014405
E-mail: elena.agirre@ehu.es

Otros autores: Alvaro Anta Sanz, Luis Javier R. Barrón, Marivi Albizu Etxeberria
Abstract:
Los modelos de predicción de contaminantes del aire son herramientas fundamentales en
la mejora de la calidad del aire. Así, el objetivo de este trabajo es la elaboración y
evaluación de un modelo estadístico que pronostique, en tiempo real, los niveles de
ozono troposférico (O3) hasta ocho horas vista en la estación de Muskiz, perteneciente a
la zona de Kostaldea en la Red Automática de Control y Vigilancia de la Calidad del Aire
de la Comunidad Autónoma del País Vasco (CAPV). Este estudio fue realizado en
diversas estaciones de la zona de Kostaldea, y en este artículo se especifican los
resultados correspondientes a la estación citada. El modelo de predicción elaborado se
fundamenta en la utilización de las redes neuronales artificiales, concretamente en el uso
del perceptrón multicapa de una única capa intermedia. Las variables de salida del
modelo son los niveles horarios de O3 hasta ocho horas vista en la estación de Muskiz. El
conjunto de variables de entrada del modelo está formado por los valores horarios del
momento en el que se realiza la predicción y los valores pasados horarios de variables
meteorológicas y de las concentraciones de ozono y dióxido de nitrógeno (NO2). Estos
valores fueron registrados en la Red Automática de Control y Vigilancia de la Calidad del
Aire de la CAPV que gestiona el Departamento de Medio Ambiente y Ordenación del
Territorio del Gobierno Vasco. El estudio se realizó con los valores de las citadas
variables recogidos en la estación de Muskiz durante el periodo 2001-2004, de forma que
los datos del trienio 2001-2003 se emplearon para establecer el modelo y los datos del
año 2004 fueron utilizados para medir cuantitativamente la calidad de ajuste del modelo.
Para cada predicción se determinó un perceptrón multicapa, en el que se aplicó el
algoritmo de aprendizaje del gradiente conjugado escalado. Los valores de los
estadísticos del Kit de Validación del Modelo fueron comparados con los valores
correspondientes a la observación (concentración real de ozono), de donde se concluyó
que el modelo desarrollado es un modelo de predicción eficaz para predecir niveles de
ozono hasta ocho horas vista en la estación de Muskiz.

Palabras clave: ozono troposférico, modelos de predicción, redes neuronales artificiales,


perceptrón multicapa.

2
1. INTRODUCCION

En la actualidad los principales causantes de la contaminación atmosférica son los


elevados niveles de ozono troposférico (O3), óxidos de nitrógeno (NOx), monóxido de
carbono (CO) y partículas. El ozono troposférico es un contaminante secundario, que se
origina como consecuencia de las reacciones que se producen entre los óxidos de
nitrógeno y los compuestos orgánicos volátiles (COVs) bajo la radiación del sol (Finlayson
y Pitts, 1986). Hoy día están muy extendidos los problemas de calidad del aire originados
por las altas concentraciones de ozono que se producen sobre todo durante la época
estival. Por ello, en diciembre de 1999 mediante el Protocolo de Gotemburgo (Suecia) se
establecieron los valores objetivo a alcanzar para el año 2010 para los contaminantes
atmosféricos más relevantes. En la Comunidad Autónoma del País Vasco (CAPV) el
departamento de Medio Ambiente y Ordenación del Territorio del Gobierno Vasco,
basándose en los datos registrados en la Red de Calidad y Control de Vigilancia de la
Calidad del Aire que gestiona, se ha encargado de efectuar el estudio y seguimiento de la
evolución de los principales contaminantes atmosféricos en esta Comunidad, y en ellos el
ozono se presenta como uno de los contaminantes a destacar (Gobierno Vasco, 2001;
Gobierno Vasco, 2004).

Las continuas exposiciones a elevados niveles de ozono pueden ser perjudiciales


para la salud humana (WHO, 2003). Los modelos de predicción de contaminantes
atmosféricos pueden jugar un papel a destacar en el control y vigilancia de la calidad del
aire, especialmente a la hora de avisar sobre situaciones de posible riesgo para la salud
humana, por lo que sería de interés disponer de un modelo eficaz que permitiera conocer
de antemano los niveles de ozono también en los distintos puntos de la CAPV.

Hasta la fecha, las técnicas más utilizadas en el diseño de modelos de predicción


de contaminantes atmosféricos se han basado en el desarrollo de modelos físico-
químicos como el Urban Airshed Model (UAM) (Scheffe y Morris, 1993), modelos
estadísticos basados en análisis de series temporales (Simpson et al., 1983; Kuang-
Jung, 1992) o de regresión lineal múltiple (Cardelino et al., 2001) y modelos
fundamentados en el uso de redes neuronales artificiales (Elkamel et al., 2001; Agirre et
al. 2006). En el caso del ozono, así como en el caso de otros contaminantes
atmosféricos, estudios comparativos entre los diferentes modelos de predicción han
probado un ajuste superior en las predicciones obtenidas mediante el uso de modelos
basados en la utilización de las redes neuronales artificiales (Gardner et al., 2000; Agirre,
2003).

Los modelos basados en el uso de redes neuronales artificiales son modelos


matemático-computacionales que poseen una elevada capacidad de generalización y de
tratamiento de problemas no lineales, y además no requieren del conocimiento
exhaustivo de la distribución de la variable de estudio.

Así, este equipo de investigación ha elaborado y evaluado un modelo basado en


el uso de las redes neuronales artificiales, para predecir, en tiempo real, los niveles de
ozono a corto plazo en diversas estaciones de la Red Automática de Control y Vigilancia
de la Calidad del Aire de la CAPV. En este artículo se van a mostrar detalladamente los

3
resultados de las predicciones horarias de ozono hasta ocho horas vista obtenidas en la
estación de Muskiz, ubicada en la zona de Kostaldea (en la costa del País Vasco).

2. BASE DE DATOS

Para la realización de este trabajo se utilizaron los valores horarios de los


contaminantes atmosféricos (O3 y NO2) y variables meteorológicas de temperatura,
humedad relativa, presión, radiación solar, velocidad y dirección del viento registrados en
el periodo 2001-2004 en la estación de Muskiz (lat.: 43º19´15´´, long.: 3º6´47´´, alt.;30),
perteneciente a la Red Automática de Control y Vigilancia de la Calidad del Aire de la
CAPV . La tabla 1 muestra las variables de contaminación y meteorología que fueron
utilizadas como variables de entrada en el modelo de predicción.

Notación Variables
TE Temperatura (ºC)
HU Humedad relativa (%)
PR Presión (kpa)
RA Radiación solar (cal cm-2 h-1)
GR Gradiente térmico (ºC)
VV Velocidad del viento (m/s)
DV Dirección del viento (Nº)
O3 Ozono (µg/m3)
NO2 Dióxido de nitrógeno (µg/m3)

Tabla 1. Variables de meteorología y contaminación.

Por otra parte, trabajos realizados en la CAPV han mostrado la importancia de la


utilización de componentes periódicas como variables de entrada del modelo (Agirre,
2003), por lo que a las variables de entrada de la tabla 1 se sumaron las variables de
entrada sen(2 h/24), cos(2 h/24), sen(2 d/7) y cos(2 d/7), donde h = 1, …, 24 es la
hora del día y d = 1, 2, …, 7 es el día de la semana. Los datos correspondientes al trienio
2001-2003 fueron utilizados para la construcción del modelo y el conjunto de validación lo
formaron los datos correspondientes al año 2004.

4
3. METODOLOGIA

3.1 Técnica utilizada. El perceptrón multicapa

El concepto de red neuronal artificial data de 1943 (McCulloch y Pitts, 1943). Las
redes neuronales artificiales se generaron como simulación del sistema nervioso humano,
siendo la neurona el elemento fundamental. En función de las características de las
neuronas, de la topología de la red (estructura y tipo de conexiones) y de la regla de
aprendizaje que se utilice se originan distintos tipos de redes neuronales artificiales. El
perceptrón multicapa (MLP, Multilayer Perceptron) es la red neuronal artificial con mayor
número de aplicaciones prácticas (Rumelhart et al., 1986).

El perceptrón multicapa consta de al menos tres capas: la capa de entrada, la(s)


capa(s) intermedia(s) o capa(s) oculta(s) y la capa de salida. La capa de entrada recibe la
información que entra del exterior a la red. Esta información se propaga hacia delante, de
forma que las entradas se multiplican por los pesos sinápticos y la suma total de estos
productos llega a las neuronas de la capa intermedia. A la suma resultante en cada
neurona de la capa intermedia se le aplica una función de transferencia, y el resultado es
la entrada de la siguiente capa. Puede haber una o varias capas intermedias. Finalmente,
la capa de salida produce la salida del perceptrón multicapa. La figura 1 muestra un
perceptrón multicapa con 9 neuronas en la capa de entrada, 4 neuronas en la capa
intermedia y 1 neurona en la capa de salida.

Salida

Capa Capa Capa


de entrada intermedia de salida

Figura 1. Perceptrón multicapa 9-4-1.

La función de transferencia determinará las relaciones entre las neuronas de las


distintas capas. Las funciones de transferencia no lineales más habituales son la función
logarítmico sigmoidal de la ecuación 1 y la función tangente sigmoidal de la ecuación 2.

1
logsig(x) = (1)
1 + e− x

e x − e− x
tansig(x) = (2)
e x + e− x

5
Las redes neuronales artificiales, y en concreto el perceptrón multicapa, poseen la
capacidad de aprender de los patrones que les son introducidos y de los errores que
cometen en el proceso de aprendizaje de patrones, de forma que finalmente son capaces
de identificar un patrón no visto anteriormente. Por ello se dice que una red neuronal
artificial adecuadamente entrenada ha de tener capacidad de generalización. El proceso
de aprendizaje es equivalente al proceso de minimización del error E entre los valores
objetivo (t1, t2,…, tL)t y las salidas del perceptrón multicapa (y1, y2,…, yL)t definido como se
indica en la ecuación 3

1 L
E= ∑ (tk − yk )2 (3)
L k =1

donde L es el número de neuronas de la capa de salida. La salida del perceptrón


multicapa se compara con la salida objetivo o salida deseada, y se retrocede hacia atrás
en la red, produciéndose un ajuste en los pesos de la red para que la diferencia entre la
salida de la red y la salida objetivo sea menor. Este método de aprendizaje es conocido
como backpropagation o método de aprendizaje con retropropagación. Una vez se ha
alcanzado el mínimo de la función error E, finaliza el aprendizaje.

3.2 Construcción del modelo

El modelo diseñado tiene como base el perceptrón multicapa con una única capa
intermedia (Hornik et al., 1989), que posee un número de neuronas a determinar
mediante procedimiento de prueba-error (Amari et al, 1997). A su vez, la capa de salida
contiene una neurona, que es la predicción de ozono o variable de salida del modelo,
O3(t+k) para el instante t+k, con k = 1, …, 8. Asimismo, para determinar el número de
neuronas de la capa de entrada se tomaron los valores pasados (en los instantes t − z, z
= 0, 1, 2,…, 24) de las variables de contaminación, meteorología y componentes
periódicas y, en general, mediante el método de regresión por pasos sucesivos con filtro
de tolerancia se fijaron las entradas de cada modelo de predicción para cada instante t+k
(k = 1, 2, …, 8). La tabla 2 muestra las variables de entrada (registros recogidos durante
el periodo 2001-2003) utilizadas en el modelo de predicción de ozono hasta ocho horas
vista en la estación de Muskiz.

6
Salidas Variables de entrada
O3(t+1) O3(t) RA(t- DV(t-5) TE(t- PR(t-6)
22) 10)
O3(t+2) O3(t) RA(t- DV(t-5) TE(t- PR(t-6)
22) 10)
O3(t+3) O3(t) RA(t- O3(t- TE(t-7) PR(t-4) PR(t- PR(t- PR(t-
21) 13) 5) 6) 12)
O3(t+4) O3(t) RA(t- TE(t-6) O3(t- PR(t-3) PR(t- PR(t- PR(t-6) PR(t-
20) 12) 4) 5) 11)
O3(t+5) O3(t) O3(t- TE(t-5) PR(t-3) PR( t- PR(t- PR(t- PR(t-
4) 5) 6) 10)
11)
O3(t+6) O3(t) O3(t- TE(t-4) PR(t-2) PR(t-5) PR(t-
10) 9)
O3(t+7) O3(t) O3(t-9) TE(t-3) PR(t-1) PR(t-4) PR(t-
8)
O3(t+8) O3(t) O3(t-8) TE(t-2) PR(t) PR(t-3) PR(t-
7)

Tabla 2. Variables de entrada en el modelo de predicción de ozono hasta ocho horas


vista en Muskiz.

La tabla 2 muestra las variables de entrada más relevantes del modelo de


izquierda a derecha en orden decreciente. Así, la variable que indica la concentración de
ozono en el instante en el que se realiza la predicción, O3(t), es la variable que explica el
mayor porcentaje de la varianza en los modelos de predicción de ozono a k horas vista (k
= 1, …, 8) en la estación de Muskiz. También destacan los valores de la variable ozono,
radiación solar y temperatura en instantes pasados. Por el contrario, en este caso las
componentes periódicas no forman parte del conjunto de las variables de entrada.

En este estudio la función tangente sigmoidal estableció las conexiones entre la


capa de entrada y la capa intermedia, y la función lineal conectó las neuronas de la capa
intermedia con la neurona de la capa de salida. La ecuación 4 presenta la ecuación
matricial del modelo:

y = W 2 (tansig( W 1 x + b 1 ))+ b 2 (4)

donde W 1 es la matriz de pesos que conecta la capa de entrada con la capa intermedia,

W 2 la matriz de pesos que conecta la capa intermedia con la capa de salida, b 1 el


umbral correspondiente a la capa intermedia, b 2 el umbral correspondiente a la capa de
salida, x el vector de entrada e y el vector de salida.

7
Finalmente, se aplicó el algoritmo del gradiente conjugado escalado (SCG, scaled
conjugate gradient). Este algoritmo se deriva del algoritmo de retropropagación y posee
mayor velocidad de convergencia que otros algoritmos de aprendizaje (Moller, 1993).

3.3 Ajuste de las predicciones

Una vez construido el modelo, para determinar numéricamente la bondad de


ajuste del modelo se calcularon los estadísticos del Kit de Validación del Modelo
(Comisión Europea, 1994). Dichos estadísticos se recogen en la tabla 3:

Estadístico Expresión
(Co − Co ) − (C p − C p )
Coeficiente de correlación R=
( SC p )( SCo )
Error cuadrático medio normalizado (Co - C p ) 2
(NMSE, Normalized Mean Square NMSE=
Error) (Co ) (C p )
Factor de dos
0,5 ≤ Co/Cp ≤ 2
(FA2, factor of two)
Co - C p
Sesgo fraccional FB= 2
(FB, Fractional Bias) Co + C p

Varianza fraccional SCo - SC p


FV, Fractional Variance) FV= 2
SCo + SC p

Tabla 3. Estadísticos del Kit de Validación del Modelo.

La notación que se utiliza en los estadísticos del kit es la siguiente: Cp es la


predicción, Co el valor real, C p y Co son las medias aritméticas de Cp y Co y SCp y SCo
son las desviaciones típicas de estos valores respectivamente. Los valores de los
estadísticos correspondientes a la observación o concentración real de ozono en el
instante t+k (k = 1, …, 8) indican el mejor ajuste, siendo R = 1, NMSE = 0, FA2 = 1, FB =
0 y FV = 0.

8
4. RESULTADOS

Se establecieron ocho perceptrones multicapa y se pusieron en funcionamiento,


de modo que se obtuvieron los valores de las predicciones de ozono hasta ocho horas
vista en la estación de Muskiz. Tras la elaboración y puesta en marcha de los modelos,
para determinar la bondad del ajuste de las predicciones obtenidas se calcularon los
estadísticos del Kit de Validación del Modelo sobre la base de datos correspondiente al
año 2004 (tabla 4).

NMSE R FA2 FB FV
O3(t+1) 0,0026 0,9938 0,9762 -0,0016 0,0484
O3(t+2) 0,0123 0,9702 0,9674 -0,0114 0,1184
O3(t+3) 0,0241 0,9460 0,9504 -0,0124 0,2338
O3(t+4) 0,0403 0,8987 0,9440 -0,0186 0,2955
O3(t+5) 0,0510 0,8848 0,9346 -0,0113 0,4298
O3(t+6) 0,0350 0,9342 0,9355 -0,0164 0,4937
O3(t+7) 0,0798 0,8565 0,9094 -0,0265 0,7604
O3(t+8) 0,0904 0,8419 0,9038 -0,0360 0,8702

Tabla 4. Estadísticos del kit de validación del modelo en Muskiz (2004).


El valor del error cuadrático medio normalizado está comprendido entre 0,0026 y
0,0904; los valores del coeficiente de correlación son positivos y varían en el intervalo
[0,8419, 0,9938], siendo el valor inferior el correspondiente a la predicción de ozono a
ocho horas vista y el valor superior el correspondiente a la predicción de ozono a una
hora vista; análogamente, los valores del factor de dos son elevados, e indican en el peor
de los casos que el 90,38% de los valores del ratio entre la observación y la predicción de
ozono a ocho horas vista están comprendidos en el intervalo [0,5, 2], y en el mejor de los
casos que el 97,62% de los valores del ratio correspondiente a la predicción de ozono a
una hora vista están en el intervalo [0,5, 2]. Estos tres valores de los estadísticos ya
indican un ajuste de calidad de las predicciones de ozono hasta ocho horas vista. En
cuanto a los valores del sesgo fraccional y la varianza fraccional se puede observar que
son relativamente pequeños, alcanzándose los valores mayores para la predicción de
ozono a ocho horas vista.

Consecuentemente, los valores de los estadísticos del Kit correspondientes a las


predicciones de ozono hasta ocho horas vista (O3(t+k), k = 1, 2, …, 8) demuestran la
calidad de los resultados obtenidos mediante el modelo de predicción de ozono en
cuestión en la estación de Muskiz.

9
5. CONCLUSIONES

En primer lugar, se debe destacar el uso del perceptrón multicapa como base del
diseño de modelos de predicción de ozono hasta ocho horas vista. En segundo lugar, se
prueba la importancia de la concentración de ozono en el instante en el que se realiza la
predicción como variable de entrada más relevante del modelo de predicción. Asimismo,
los valores pasados de las variables meteorológicas como la radiación solar, la
temperatura, la dirección del viento y la presión juegan un papel fundamental como
variables de entrada del modelo de predicción de ozono planteado. En tercer lugar,
mediante el cálculo de los valores de los estadísticos del Kit de Validación del Modelo
correspondientes a las predicciones de ozono hasta ocho horas vista en Muskiz se ha
cuantificado la bondad del ajuste de las predicciones que proporciona el modelo, y se ha
demostrado que el modelo propuesto es eficaz para el fin para el que fue diseñado tanto
en la estación de Muskiz como en el resto de estaciones de Kostaldea (Agirre 2005 et
al.).

Consecuentemente, se podría afirmar que la técnica utilizada en la elaboración de


este modelo de predicción de ozono basado en la utilización del perceptrón multicapa de
una única capa es una técnica de gran utilidad en el área de la contaminación
atmosférica.

Agradecimientos

Los autores de este trabajo agradecen al departamento de Medio Ambiente y


Ordenación del Territorio del Gobierno Vasco la facilitación de los datos de la Red
Automática de Control y Vigilancia de la Calidad del Aire, así como la financiación de este
trabajo de investigación mediante el proyecto “Elaboración y evaluación de un modelo de
predicción, en tiempo real, de los niveles de ozono en Kostaldea y Rioja Alavesa basado
en el uso del perceptrón multicapa” (nº expediente 175P/2005).

10
Referencias

Agirre, E., 2003. Elaboración de un modelo estadístico de pronóstico a corto plazo, en


tiempo real, de los niveles de O3 y NO2 en la ciudad de Bilbao. Tesis Doctoral Universidad
del País Vasco, Bilbao.

Agirre, E., Anta, A., Barrón, L.J.R., 2005. Elaboración y evaluación de un modelo de
predicción, en tiempo real, de los niveles de ozono en Kostaldea y Rioja Alavesa basado
en el uso del perceptrón multicapa”, Gobierno Vasco (nº expediente 175P/2005).

Agirre, E., Ibarra, G., Madariaga, I., 2006. Regression and multilayer perceptron based
models to forecast hourly O3 and NO2 levels in the Bilbao area. Environmental Modelling
and Software 21, 430-446.

Amari, S.I., Murata, N., Müller, K.R., Finke, M., Yang, H., 1997. Asymptotic statistical
theory of overtraining and cross-validation. IEEE Transactions on Neural Networks 8, 985-
996.

Cardelino, C., Chang, M., St. John, J., Murphey, B., Cordle, J., Ballagas, R., Patterson, K,
Stogner, J., Zimmer-Dauphinee, S., 2001. Ozone predictions in Atlanta, Georgia: Analysis
of the 1999 Ozone Season. Journal of the Air and Waste Management Association 51,
1227-1236.

Comisión Europea, 1994. The Evaluation of Models of Heavy Gas Dispersion. Model
Evaluation Model Evaluation Group Seminar.Office for Official Publications of the
European Communities. L-2985. Luxemburg.

Elkamel, A., Abdul-Wahab, S., Bouhamra, W., Alper, E., 2001. Measurement and
prediction of ozone levels around a heavily industrialized area: a neural network
approach. Advances in Environmental Research 5, 47-59.

Finlayson-Pitts, B.J., Pitts, J.N., 1986. Atmospheric chemistry: fundamentals and


experimental techniques. Wiley, New York.

Gardner, M.W., Dorling, S.R., 2000. Statistical surface ozone models: an improven
methodology to account for non-linear behaviour. Atmospheric Environment 34, 21-34.

Gobierno Vasco, 2001. Calidad del aire en la Comunidad Autónoma Vasca en el período
1996-2000. Servicio de Publicaciones del Gobierno Vasco, Vitoria-Gasteiz.

Gobierno Vasco, 2004. Aire-Ruido. Servicio de Publicaciones del Gobierno Vasco,


Vitoria-Gasteiz.

Hornik K., Stinchcombe M., White H. 1989. Multilayer feedforward networks are universal
approximators. Neural Networks 2, 359-366.

Kuang-Jung, H., 1992. Time series analysis of the interdependences among air pollutant.
Atmospheric Environment 26B, 491-503.

McCulloch W.S., Pitts W., 1943. A logical calculus of ideas immanent in nervous activity.
Bulletin of Mathematical Biophysics 5, 115-133.

11
Moller M.F., 1993. A scaled conjugate gradient algorithm for fast supervised learning.
Neural Networks 6, 525-533.

Rumelhart, D.E., Hinton, G.E., Williams, R.J., 1986. Learning internal representations by
error propagation. MITT Press, Cambridge.

Scheffe, R.D., Morris, R.E., 1993. A review of the development and application of the
urban airshed model. Atmospheric Environment 27B, 23-39.

Simpson, R.W., Layton, A.P., 1983. Forecasting peak ozone levels. Atmospheric
Environment 17, 1649-1654.

WHO, 2003. Health aspects of air pollution with particulate matter, ozone and nitrogen
dioxide. Report of a WHO Working Group, Bonn, Germany.

12