Está en la página 1de 4

Traducido del inglés al español - www.onlinedoctranslator.

com

Predicción de la demanda ecológica de agua basada en


máquinas de vectores soporte
Lingling ZHANG Yanfu WEI
Escuela de Administración Pública, Universidad Hohai, Oficina de Asuntos del Agua de la ciudad de Laizhou,
Ciudad de Nankín, China ciudad de linzhou, china
llzhang007@163.com Zongzhi WANG
Instituto de Investigación Hidráulica, ciudad de Nanjing, China

Abstracto—Este artículo presenta un modelo que combina una máquina de el consumo de agua pasado, no considera ninguna otra variable, y
vectores de soporte con un algoritmo genético para predecir la demanda el resultado del pronóstico influye mucho en el valor inicial. El
ecológica de agua. Con el conflicto cada vez mayor entre la oferta y la demanda documento [5] calculó el volumen de demanda ecológica de agua
de recursos hídricos, el volumen de la demanda ecológica de agua se está de la cuenca Haihe. Además, existen el método de una sola variable
volviendo escaso. La predicción de la demanda ecológica de agua es una parte y el método de pronóstico multivariable. Según el análisis de
importante de la programación y gestión de los recursos hídricos. Sin embargo, regresión múltiple, el método de modelización utilizado para la
la escasez de muestras y la autolimitación del método de pronóstico demanda ecológica de agua no es satisfactorio.
convencional hacen que la precisión sea baja. La máquina de regresión de
vectores de soporte (SVRM) se basa en la teoría del aprendizaje estadístico con
la regla del riesgo estructural mínimo. Tiene algunas ventajas, como el II. STEORÍA DEL APRENDIZAJE TÁDICO
tratamiento de datos de muestras pequeñas, la dimensión alta, la optimización Es un aspecto importante para el aprendizaje automático en la
global y la excelente capacidad de generalización. En lo que respecta al tecnología de inteligencia moderna buscar reglas estadísticas a partir de
problema de la memoria a la que la matriz del núcleo de acceso aumenta con el los datos de observación (las muestras) y utilizar estas reglas para
número de muestras, lo difícil es resolver los multiplicadores de Lagrange (el
pronosticar los datos futuros o los datos de observación imposibles.
coeficiente de las muestras). El artículo adopta el método óptimo común: el
Ahora bien, una de las bases teóricas importantes del método de
algoritmo genético (GA) para resolver los coeficientes de la muestra. En
aprendizaje automático es la estadística; la estadística tradicional
comparación con los modelos tradicionales de pronóstico de la demanda de
investiga la teoría asintótica cuando el número de muestra tiende al
agua urbana, GA-SVRM se basa en la teoría matemática estable, tiene un
infinito. Sin embargo, en la pregunta realista, el número de muestra es
pronóstico de alta precisión, mejor aplicabilidad y valor general en la compleja
limitado, incluso si se trata de una muestra pequeña. Por lo tanto,
predicción ecológica de la demanda de agua.
algunos métodos de aprendizaje, que en teoría son muy destacados, en
realidad no son satisfactorios en la aplicación práctica. A partir de los
Palabras clave: Predicción de la demanda ecológica de agua,
años 60, V. Vapnik[6] y demás se dedicaron a la investigación de la teoría
Máquina de vectores de soporte, Teoría del aprendizaje estadístico,
estadística de muestras limitadas, y la llamaron teoría estadística del
Algoritmo genético.
aprendizaje (SLT). Hasta las etapas intermedias de los años 90, con el
desarrollo de la teoría y la madurez, la red neuronal de otros métodos
yo yoNTRODUCCIÓN de aprendizaje teóricamente carece de un progreso sustancial, a esta
El entorno ecológico son los requisitos para que la humanidad viva y teoría se le ha otorgado cada vez más importancia [7, 8].
se desarrolle [1]. El agua desempeña un papel clave para mantener el
entorno ecológico. Con los recursos hídricos escasos, la contradicción A. Modelo de aprendizaje general
entre la oferta de agua y la demanda se intensifica día a día. La gente Suponiendo que X es el espacio de entrada sistemático, Y es el espacio de
sólo se centra en la demanda de recursos hídricos de la industria y la salida, el modelo de aprendizaje estadístico incluye tres factores esenciales:
vida, ignorando la demanda ecológica de agua [2]. La predicción
ecológica de la demanda de agua es un medio eficaz para el programa y
la gestión de los recursos hídricos; sin embargo, la escasez de datos y la F (x): La función de distribución de probabilidad que es fija y
propia limitación del método de pronóstico a menudo causan una baja desconocida en el espacio de entrada X.
precisión del pronóstico. Existen aproximadamente tres tipos de
F(y|x):La función de distribución de probabilidad que es fija y
métodos para pronosticar la demanda ecológica de agua [3]: el método
desconocida en el espacio de salida Y.
de pronóstico por juicio, el método de pronóstico de tendencia y el
método de causas y efectos. El método de pronóstico por juicio se basa Máquina de aprendizaje (LM): puede realizar algún conjunto de funciones
en el conocimiento y la experiencia del individuo o colectivo a
f (x, a),α∈ Λ,Λes el conjunto de parámetros.
pronosticar. Puede ser puramente subjetivo, o también puede ser una
revisión subjetiva de cualquier tipo de resultado de pronóstico objetivo El problema de aprendizaje es elegir la mejor función de
(Mcdonald, Kay, 1,988). Este método ahorra tiempo, es económico, no aproximación correspondiente a la máquina de entrenamiento. La
está limitado por el material de datos, sino que solo se centra en el elección se basa en el conjunto de entrenamiento. El conjunto está
pronóstico puro, y la objetividad es mala y la precisión del pronóstico no compuesto por (x1,y1)…(xl, yl), que es una distribución independiente e
es alta. El método de extensión de tendencia se establece sobre el idéntica extraída de la distribución unida F(x,y)=F(x)F(y|x).
cambio de agua utilizada el cual puede explicarse por la teoría y el
concepto [4], este método solo relacionará la demanda futura de agua
utilizada y

1032

Uso autorizado con licencia limitado a: Universidade Estadual de Campinas. Descargado el 9 de marzo de 2024 a las 23:22:59 UTC desde IEEE Xplore. Se aplican restricciones.
Usamos f (x, a) para ajustar la relación entre entradas y riesgo real funcional en el conjunto de funcionesq(z,α)α∈Λ.Próximo,
salidas, que tiene el riesgo (pérdida). Considerada la pérdida de
expectativa matemática. Al establecer tres teoremas de la teoría del aprendizaje estadístico, estos
constituyeron la base para establecer el límite de la tasa de
R(α) =∫l(y,F(X,α))dF(X,y) convergencia de la máquina de aprendizaje, incluido el límite que no
tiene nada que ver con la distribución y el límite que se basa
El objetivo de aprendizaje busca que a0 haga que R (a0) = min R (a), y el estrictamente en la distribución. Para profundizar en el estudio del
prerrequisito conoce simplemente la muestra (x,Y). Actualmente, la teoría del problema, se define la dimensión VC que mide la complejidad de la
aprendizaje estadístico se utiliza principalmente en problemas de reconocimiento de máquina. En base a esto, se llega a una conclusión sobre todo cuando el
patrones, estimación de regresión y estimación de densidad. El artículo aplica la número de muestra tiende al infinito. Sin embargo, en un problema
estimación de regresión para pronosticar la demanda de agua. A continuación, real, el número de muestra siempre es limitado, incluso muy pequeño
resumamos las estadísticas mediante la estimación de regresión. (es decir, una situación de muestra pequeña). Para analizar la calidad del
aprendizaje de este tipo de situaciones se considera la tasa de
Estimación de regresión: haga que el resultado del entrenamiento y sea el real convergencia. La mala capacidad de generalización se analiza mediante
valor, y hacer f(x,a),α∈ Λ,es el conjunto de funciones el análisis de la tasa de convergencia, es decir, el fenómeno de ajuste.
reales, en el que contiene la regresión Finalmente, al demostrar la casi

función F(X,α0)=∫ydF(yx), el pierde


En todas partes converge el riesgo funcional, elαk(yo)obtenido
yo por el
principio de riesgo de estructura más pequeña tiene más características
funciónl (y,F(X,α))=(y−F(X,α)). 2
queαyoobtenido por el principio de riesgo de experiencia más pequeño.
¿Cómo diseñar el algoritmo concreto para implementar el principio de riesgo
B. Principio de la teoría del aprendizaje de la estadística para predecir de estructura más pequeño? La máquina de vectores de soporte surge en el
momento histórico.
La tabla expresa el proceso del principio de la teoría del aprendizaje de la
estadística para predecir, consulte la tabla 1.
III. GA-SVRMMODELO
Función de aproximación

La máquina de vectores de soporte, SVM, fue ofrecida por primera


Inducir
Deducir
vez por Cortés y Vapnik en 1995 [9]. Fue un logro significativo de la
investigación sobre aprendizaje automático de los últimos años, fue un
nuevo tipo de método de aprendizaje automático basado en la teoría del
Muestras Correcto
Predecir el valor aprendizaje estadístico. Supongamos que los datos de la muestra
obedecen a alguna distribución, de acuerdo con la teoría del aprendizaje
Juicio de intuición estadístico, el objetivo es hacer que el error entre la salida real y la
Datos de prueba
salida ideal de la función clasificada sea lo más pequeño posible, lo que
debe seguir el principio de riesgo de estructura más pequeño, no el
Para una discusión conveniente, podemos darle al problema de
Principio tradicional de riesgo de experiencia más pequeña [10,11].
aprendizaje la expresión general: plantear la hipótesis de que la medida
de probabilidad F(z) está definida en el espacio Z. Considerado el
A. Modelo de regresión SVRM
conjunto de funciones Q (z,A), el riesgo funcional más pequeño del
aprendizaje meta SVRM obtiene el hiperplano de regresión óptimo en
dimensión alta, el problema es:
R(α) =∫q(z,α)dF(z),α∈Λ yo
(1) mín. 1 ω2+C∑(ξ+ξi* i) (4)
ω,ξ,b2 i=1
La medida de probabilidad F(z) es desconocida, las muestras
z1,z2,…zl.
(2)
s.t:((ω⋅Xi)+b)−yi≤ε+ξi
Las muestras son independientes e idénticas. yi−((ω⋅X) i + b)≤ε+ξi *

La Minimización de Riesgos Empíricos (ERM) reemplaza la función de


riesgo con la llamada función de riesgo de experiencia. ξ,iξ* i≥0 i=1, 2⋅⋅⋅,norte

1yo
Remp(α) =∑q(z α) i, Su doble problema es:
yoi=1
yo yo
(3) mín.1∑∑(α i−α) i(α * * j −α ) k(
j i X,Xj )+
Se obtiene entrenando las muestras (2) 2
(
α( *)∈Ryo2 i=1j=1
yo yo

ε∑α +αi)−∑yi(α* −αi)


Vapnik había demostrado la idoneidad y condición indispensable de
que la experiencia funcional de riesgo haga converger la * i i
i=1 i=1

Identifique aquí los patrocinadores aplicables. Si no hay patrocinadores, elimine este cuadro de texto.

(patrocinadores)

1033

Uso autorizado con licencia limitado a: Universidade Estadual de Campinas. Descargado el 9 de marzo de 2024 a las 23:22:59 UTC desde IEEE Xplore. Se aplican restricciones.
(5) xmax(j) es respectivamente el valor de maximización y minimización
del valor del índice j.
)=0
yo
s.t:∑(α−i α* i
Elegir la función positiva adecuada ε, C y kernel
i=1 K(x,x*);Construir y resolver el problema óptimo
yo yo
yi−((ω⋅Xi)+b)≤ε+ξ* i mín. 1∑∑(α −α ) (α *i i *j −α)kj (X,Xj)i +
2α( *)∈R2yo i=1 j=1

0≤αi,α* i≤C,i=1, 2,...,yo yo yo


ε ∑(α*i+αi)−∑yi(α* i−αi)
k(Xi,Xj)=φ(Xi) tφ(Xj)se llama función del núcleo, i=1 i=1

∑(α−i α i)=0
yo
La función del kernel generalmente se usa de la siguiente manera: kernel polinomial *

función:k (X ,X )=(X ⋅X +1),d=1, 2,⋅ ⋅ ⋅norte;


i j i j
d
radial
0≤αi,αi
i=1
*
≤C,i=1,2,...,yo
función básica del núcleo:k(X ,X )=ExpX −X
2
i j i j 2σ2; Cómo a conseguir el óptimo

Sigmoideo núcleo función: soluciónα̂= (α̂ ,α̂1 *1 ,...,α̂yo,α̂*yot );Resolución de algoritmo genético.
k(Xi,Xj)=tanh⎡ ⎣b(Xi⋅Xj)+C⎤ ⎦.εes un valor positivo. elα̂= (α̂ α *1 , ˆ 1,..., ˆα yoα,ˆ*yot ).Aplicar el algoritmo genético.

α̂ ),
Cuando el error entre f(xi) y yi es menor que ε, el error t
no se tiene en cuenta. Cuando es mayor que ε, el error basado en el código real, codificación paraα̂= 1α̂,α̂1*,...,α̂ yo,yo* (
esF(Xi−yi)−ε.La constante C controla el grado penal. inicialización de la colonia madre, apreciación adaptativa de la colonia
madre, operación de selección, operación cruzada, operación de
cuando el error de las muestras excede ε mutación[14,15]. Construcción de una función de regresión.

. 0≤α i,αi≤C,i=1, 2,...,yo,Multiplicador de Lagrange en dual


* yo (6)
fx(=)∑(α̂* i − α̂i)k(Xi,X)+b
transformar, las variantes óptimas. i=1
Formando el ángulo de la función kernel, el problema óptimo de
la fórmula (5) no es lineal,y hay muchas variantes óptimas. dónde:bsigue la siguiente fórmula para calcular, si se elige
yo
Entonces, el problema óptimo es un problema complejo no lineal
de alta dimensión. Si aplica el método de optimización tradicional, α̂j,entoncesb=yj−∑(α̂* i−αi ˆ Xi⋅Xj +ε;si elecciónα̂* )( ) k
i=1
enfrentará grandes dificultades.
yo
B. Algoritmo genético que optimiza SVRM ,entoncesb=yk− ∑(α̂ i−α̂i)(Xi⋅Xk)−ε.
*

Algoritmo genético,GA, es un tipo de algoritmo de optimización i=1

de búsqueda estocástica global que surge de la idea de selección


IV. METROODEL PARA LA DEMANDA DE AGUA ECOLÓGICA
natural y el mecanismo de herencia natural. Es un algoritmo de
PREDICCIÓN
optimización biológica imitante.[12,13], que imita el proceso de
producción y evolución de todas las vidas y la inteligencia. Debido a Según los datos históricos en la cuenca x, el factor de influencia de la
que es apto para resolver el problema complejo óptimo en el demanda ecológica de agua es el valor bruto de la industria, el valor
mundo real, especialmente la condición adecuada flexible (solo se bruto de la agricultura, el área de riego, la población bruta y la
puede calcular el problema optimizado, sin la condición estricta población de la ciudad en la cuenca x. Primero tome los datos unidos,
diferenciable, continua, etc.), ya se ha convertido en el foco de los cinco factores anteriores como datos de entrada y la cantidad de
investigación y aplicación. Recientemente, los algoritmos genéticos demanda ecológica de agua como datos de salida. Modelado de la
se han aplicado ampliamente en la optimización combinada, el máquina de regresión de vectores de soporte con estos datos. Los
aprendizaje automático, el control adaptativo y la toma de siguientes son los resultados, ver Fig1, Fig2.
decisiones multiobjetivo, entre otros campos de la ingeniería, lo
VCONCLUSIÓN
que muestra ampliamente su efectividad y utilidad. Este problema
adopta el algoritmo genético basado en código real. Con el conflicto cada vez mayor entre la oferta y la demanda de
recursos hídricos, la demanda ecológica de agua se está volviendo

Los pasos: formular una hipótesis sobre el conjunto de entrenamiento T= escasa. La predicción de la demanda ecológica de agua es la base para
asegurar el ritmo de suministro de agua ecológica. Desempeña un papel
{(x1,y1),(x2,y2),…(xl,yl)}∈(X×Y)l,xi∈X=Rn,yi∈Y=R,yo=1,…l。Debido a la
importante en la programación y gestión de los recursos hídricos, pero
diferente dimensión del índice, el valor de la muestra debe ser unificado antes
las muestras cortas restringen la precisión de los pronósticos. Basada en
de la operación, de la siguiente manera:

X(i,j)=[X*(i,j)−Xmín.(j)]/[Xmáximo(j)−Xmín.(j)]
la teoría del aprendizaje estadístico, la máquina de vectores de soporte
es un nuevo método para pronosticar muestras pequeñas y adapta
, xmín(j),
datos de alta dimensión. Al mismo

1034

Uso autorizado con licencia limitado a: Universidade Estadual de Campinas. Descargado el 9 de marzo de 2024 a las 23:22:59 UTC desde IEEE Xplore. Se aplican restricciones.
Al mismo tiempo, evita el fenómeno de sobreajuste del pronóstico
de la red neuronal. Tiene una gran capacidad de generalización. De
acuerdo con las características de la demanda ecológica de agua, el REFERENCIAS
artículo ofrece el modelo de máquina de vectores de soporte de la
[1] Han Yuqing. Análisis sobre la construcción y política del
misma, aplica el algoritmo óptimo común: el algoritmo genético
entorno ecológico en Yi-jin-huo-luo-qi[J]. Protección del medio
optimiza el parámetro complejo de alta dimensión. Por el caso de
ambiente de Neimenggu, 2005, 17 (4): 50-52.
cálculo de x cuenca, el modelo es efectivo en la demanda ecológica
[2]Miao Hong, Wei Yanchang, Jiang Lijun. Agua de uso
de agua.
ecológico y método de cálculo [J]. Revista de Ecología, 2003,23
Fig.1 Ajuste del resultado de las muestras. (Unidad: 109metro3, Función
(6):1157-1164.
Kernel (abreviatura de KF) Unidad:104metro3
[3] Niu Huien. Revisión de la literatura sobre previsión de
No. Función del núcleo RBF Polinomio KF Sigmoideo KF la demanda de agua [J]. Revista de la universidad normal
re=2, Re σ=0,2, Re b=0,001, Re de Sichan (Ciencias Naturales). 1996,19(1):107-109. (en
C=1,1 Errar(%) ε0,11, Errar(%) C=2,0 Errar(%) chino)
ε=0,001 c=2 ε=0,001 [4]Boland JJ. Previsión del uso del agua. Un tutorial,
1 12,89 0,70 12,68 0,87 12,96 1.27 EN Torno, HC (ed.). Aplicación informática en
2 12,79 0,80 12,79 0,80 12.51 1.32 Recursos hídricos, 1985:907-916.
3 13.19 0,49 12.58 0,90 12.17 0,89 [5] Wei Yanchang, Miao Hong, etc. Cálculo de la
4 12,97 0,33 12.80 0,78 12,86 0,87
demanda ecológica de agua de la cuenca Haihe [J].
5 13.01 0,05 13.02 0,08 13.20 1.47
6 13.00 0.00 12.90 0,75 13.20 2.10 Revista de Ecología, 2004,24 (10):2101-2107.
7 12,87 0,72 12,85 0,35 12.90 0,08 [6]Vapnik VN. Estimación de dependencias basada
8 12.91 0,69 12.81 1.46 12,97 0,23 en datos empíricos. Berlín: Springer Verlag, 1982,2.
9 12,95 0,15 13.01 0,31 12,99 0,15
[7] Vápnik VN. La naturaleza del aprendizaje estadístico.
Fig.2 Previsión del resultado de la muestra de prueba. (Unidad: 109metro3, teoría. Nueva York: Springer Verlag, 1995, 3.
Función Kernel (abreviatura de KF) Unidad:104metro3

No. Pruebas Núcleo RBF Polinomio KF Sigmoideo KF [8]Cherkassky V, Mulier F. Aprendizaje


Muestras función a partir de datos: conceptos, teoría y método. Nueva
d=2,C=1,1 Re σ=0,2, d=2,C=1,1 Re σ=0,2, York: John Viley & Sons, 1997.
ε=0,001 Errar( ε ε=0,001 Errar(% ε [9] C Cortés, V Vapnik. Redes de vectores de soporte
% =0,11, ) = 0,11, [J]. Aprendizaje automático, 1995, 20: 273 - 295.
) c=2 c=2 [10] GUNN S. Máquinas de vectores de soporte
1 13.3 13.04 1,96 13.72 3.17 13.27 0,22 para clasificación y regresión [R]. Técnico
2 13.2 13.04 1.18 13.39 1,48 13.40 1,56 Informe, 1998.
3 13.6 13.28 2.20 13.63 0,29 13,34 1,876
[11] CRISTIANINI N, SHAWE TAYLORJ. Introducción a
las máquinas de vectores de soporte [M]. Cambridge:
Universidad de Cambridge. Prensa, 2000.
AAGRADECIMIENTOS:
[12] Xu Zongben. Inteligencia calculadora. (primera copia)---
Este trabajo fue financiado en parte por una subvención Imitando el cálculo de la evolución[M].Beijing: high education
(07JC790015) de la Fundación de Ciencias Sociales del Ministerio de press.2004.
Educación de China.
[13]Zhang Wenxiu, Liang Yi. Base numérica del algoritmo
genético[M]. Xian: universidad de transporte de xian. prensa, 1999.
(en chino)
[14]Jin Juliang, Yang Xiaohua. Caso mejorado de algoritmo
simplemente genético---AGA[J]. Teoría y práctica de la ingeniería de
sistemas. 2001,21(4):8-13.
[15]Wang Zongzhi. Métodos y sus aplicaciones de reconocimiento de
patrones de inteligencia de recursos hídricos [D].2005,1.

1035

Uso autorizado con licencia limitado a: Universidade Estadual de Campinas. Descargado el 9 de marzo de 2024 a las 23:22:59 UTC desde IEEE Xplore. Se aplican restricciones.

También podría gustarte