基于模型的矿区重金属污染时间序列预测

基于模型的矿区重金属污染时间序列预测基于ARIMA模型的矿区重金属污染时间序列预测

江西、安徽、福建、湖南等省是我国南方重要的有色金属矿床，其中多为含硫多金属矿床。多金属硫化物矿区重金属污染和生态环境恶化是一个严重的全球性问题。特别是在我国，由于选矿废水、尾矿、废石处置等技术管理上的缺陷。多金属硫化物矿床的开采给矿区周围的水体和土壤带来了严重的重金属污染。尾矿库废水流入河流，居民用河水灌溉农田。河流中溶解的悬浮物或重金属长期积累在流域土壤中，造成水和土壤重金属的复合污染。近年来，国内外学者对硫多金属矿区重金属污染现状进行了研究，包括重金属含量、形态特征及其对矿区植被的影响，但总体来说，对矿区重金属污染的监测、评价和预测研究较少。应用时间序列分析的ARIMA方法，建立矿山重金属污染浓度预测模型，探索矿山废水中重金属浓度的预测方法和变化规律。

时间序列是将同一现象在不同时间的数值按时间顺序排列的序列。时间序列分析方法属于统计学的范畴。通过对时间序列的研究、分析和处理，提取系统的相关信息，从而揭示时间序列本身的结构和规律，认识系统的内在特征，掌握系统与外界的关系，推断系统未来的变化和行为。因此，时间序列分析方法不仅是一种数据处理方法，也是一种系统的分析方法。随着时间序列分析方法的不断成熟，它已广泛应用于气象、天文、经济、管理、机械、生物、医学、水利、化工等领域。和农林等部门和研究领域，取得了良好的效果。矿山重金属土壤和水污染的变化也可以看作是一个时间序列。比如某监测站废水排放口重金属的监测值会随着时间的推进而发生变化。通过对相关监测值建立时间序列模型，利用历史数据进行参数估计后，可以对监测值进行模拟和预测。本文利用时间序列分析模型ARIMA对某铜硫矿区1995年1月至2007年12月的锌含量监测结果进行建模分析，并利用建立的模型对2008年1月至2008年6月的锌含量进行预测。并与此期间的实际计算数据进行对比，验证模型的可行性，从而为各级政府的矿业与环保行为和矿业与环保政策法规的制定提供科学依据，为贵金属污染评价和预测分析提供可行途径。

一、案例分析

对尾矿库每天排放的废水每月不定期监测2 ~ 3次，是我国南方某铜硫矿环保部门承担的环境监测预报工作的重要组成部分。通过对该矿山的调查，收集了1995-2008年以来土壤和水体中重金属污染浓度的历史数据。如何从这些数据中挖掘隐含的规律性信息，预测水土污染的变化趋势，已成为矿区环境保护管理的现实需要。限于篇幅，笔者仅取1995-2008年重金属Zn的浓度作为时间序列实例。

二、ARIMA模式的基本原理

时间序列预测模型分为自回归(AR)模型和移动平均(MA)模型。自回归综合移动平均(ARIMA)模型等。".尤其是1970年由Box和Jenkins提出的ARIMA(自回归综合移动平均)综合自回归移动平均模型最为经典，也称为BOX-Jenkins方法。该模型适用于非平稳时间序列。在应用中，需要通过几次差分将非平稳时间序列转化为平稳时间序列，然后对平稳时间序列进行定阶和参数估计，得到P和q的值，再根据ARIMA(P，d，q)模型对时间序列进行预测和分析。实质上，ARIMA模型是对时间序列进行平滑，然后用ARMA模型进行处理。

根据定义，它是:一个非平稳时间序列Yt{y1，y2，y3}到▽Yt=Yt-Yt-1，▽2Yt=▽(▽Yt)=▽(Yt-Yt-1)，...

XT = EQ 1Xt-1+2Xt-2+…+pXt-p+at-θ1at-1-θ2at-2-…-θqat-q，

Xi称为综合自回归移动平均序列，即ARIMA(P，d，q)。

参考后移运算符B，上述公式可以写成

Xt=θ(B)at，

其中，

(B)=1- 1(B)- 2(B)2-…- p(B)p，

θ(B)=1-θ1(B)-θ2(B)2-…- p(B)p，

且(B)=0且θ(B)的所有根的模大于1；1，2，…，p是自回归参数；θ1，θ2，…，θp是移动平均参数；随机项at是白噪声序列，正态分布，方差σ2e，相互独立。所以ARIMA模型的一般表达式是

(B)(1-B)dXt=θ(B)at。

(A)稳定时间序列

ARIMA模型在处理非平稳时间序列时，首先将非平稳时间序列转化为平稳时间序列，这是ARMA模型可以处理的形式，然后对其进行分析和建模。首先，以1995-2007年尾矿库废水总排放口锌浓度月平均值作为分析样本。通过绘制时间序列折线图(图1)可以看出，Zn历年的放电序列具有明显的趋势性，样本时间序列为非平稳时间序列；大部分时间Zn浓度高于国家地表水水质ⅲ类(1.0mg/L)标准，大部分高于ⅴ类(2.0mg/L)标准，说明废水排放没有达到国家标准。使用EViews6.0软件进一步测试该序列的ADF根。ADF检验时要选择常数项和时间趋势项，检验结果如表l所示，可以看出ADF检验的统计量为-2.01346，大于1%显著性水平的T检验的P值(-2.580065)，所以有单位根，因此判断时间序列不稳定，时间序列未通过检验，需要通过其差值使样本时间序列稳定。一阶差分后(见表1)，ADF检验的统计量为-7.11443，小于1%、5%、10%显著水平的T检验的P值。所以没有单位根，说明样本变化趋势已经消除，时间序列一直处于稳定状态。

(2)序列集中化

设一阶差分后的平稳时间序列为Xt{x1，x2，…，xN}，计算该时间序列的均值。

平稳过程均值的无偏估计。

那么w1，w2，w3…就是一个零均值序列。

根据(L) =2.558478，再根据(2)，数据集中后的值w1，w2，w3…分别为-0.026，0.02，0.65，-0.717，O.2O，0.2，-0.125，0.061，-0.446。Wt折线图如图2所示。

(3)参数估计

在判断ARIMA模型的形态和阶次时，需要分析wt的自相关函数和偏相关函数，并根据统计图进一步分析时间序列特征。

自协方差函数的公式是

自相关函数的计算公式是

部分功能计算公式为

(5)

(4) ARIMA模型判断和定阶

根据样本自相关、截断和白相关函数拖尾，初步判断适合时间序列的模型类型。零均值平稳时间序列的自相关函数和偏自相关函数的统计特征如表2所示。

零均值平稳时间序列自相关函数和偏自相关函数的统计特征

模型

AR(p)

马(问)

AR(p，q)

自相关函数

蔓延的

缩短

蔓延的

部分自相关函数

缩短

蔓延的

利用EViews6.0软件制作wt的自相关函数图和部分自相关函数图(图3)，发现两个表的样本时间序列都呈现拖尾特征，符合ARMA(p，Q)模型特征，选择ARIMA模型是合适的。

当原始时间序列稳定后，发现尾矿库废水排放口Zn含量的时间序列只有长期趋势，没有季节性趋势。因为一阶差分可以消除趋势，所以这里选择1作为差分算子，即D = L。

确定ARIMA模型p、q阶的方法有三种:自相关函数和偏相关函数分析法、FPE准则、AIC和BIC准则，其中自相关数和偏相关函数分析法以及AIC和BIC准则应用最为广泛。

AIC和BIC标准定义为

如果

然后确定ARMA模型的阶数为(p，q)，σ2α为相应序列的最大似然估计。

这里，时间序列的阶是通过结合时间序列的自相关函数和偏相关函数的特征与AIC和BIC准则来确定的。首先，根据自相关函数和偏相关函数的截断和拖尾特性，初步确定样本的P和Q的取值范围。然后，根据AIC和BIC标准，并参考其他统计参数，逐步选择最佳P和Q值。

从自相关函数图和偏相关函数图(图3)可以看出，ACF被三阶截断，即Q = 1，2，3；PACF按1或2阶截断，即p = 1，2。因此，本文建立的初步模型有ARIMA(0，L，L)，ARIMA(0，L，2)，艾尔玛(L，L，1)，ARIMA (1，L，2)，ARIMA(1，L，0)，ARIMA(1)

对上述10个模型进行参数估计，经过反复拟合(表3)，综合考虑AIC值、SC值、拟合优度R2和调整后的可确定系数，得到时间序列{wt}的理想模型。从ARMA(p，Q)对应的模型效果指标汇总表(见表3)可以看出，ARMA(l，2)模型的AIC和SC值最小，R2和值最大。因此，在上述10个模型中，ARIMA(1，1，2)模型的拟合效果最好，其参数如表4所示，也是待选模型。

表3不同wt序列阶数的ARIMA(p，L，Q)模型的AIC值、SC值和适合度

ARIMA(p，L，Q)的不同组合

美国化学师学会(American Institute of Chemists)

南卡罗来纳州

r平方

调整后的R平方

ARIMA(0，1，1)

3.270973

3.290608

0.5901升

0.590213

ARIMA(0，1，2)

3.251041

3.290311

0.616272

0.6升15

ARIMA(左，右，左)

3.229658

3.269099

0.637927

0.632913

ARIMA(1，1，2)

3.201722

3.260884

0.768484

0.758795

ARIMA(l，l，0)

3.337243

3.356964

0.640273

0.643247

ARIMA(2，1，0)

3.323871

3.363484

0.668217

0.662709

ARIMA(2，1，2)

3.219309

3.297537

0.670130

0.655435

ARIMA(0，1，3)

3.240815

3.29972

0.634191

0.624114

ARIMA(1，1，3)

3.22202

3.300920

0.763116

0.748379

ARIMA(2，1，3)

3.228481

3.327515

0.672971

0.653322

表4 ARIMA(1，1，2)模型参数

参数类型

系数

标准误差

t值

概率p值

AR1

0.729

0100578

7.248057

0.000

MA1

-1.3156

0.143145

-9.190712

0.000

MA2

0.321139

0.141070

2.276457

0.0242

根据模型系数(表4)，给出ARIMA(l，L，2)的具体形式:

(l-0.729 B)(l-B)Yt =(l+3156 B+0.321139 B2)at；。

在应用ARIMA模型时，由于需要对数据进行预处理，使时间序列数据具有平稳性、零均值和差分性，因此需要通过逆变换得到所需的预测数据。

(5)模型检验和预测

根据ARIMA (1，1，2)模型，拟合结果和残差变化结果如图4所示。从图中可以看出，模型的拟合结果非常好，预测值与真实值的相关指数达到98%，巨大残差随机分布在置信区间内，属于白噪声序列，证明建立的模型是合理的。

在95%的置信区间内，利用ARIMA(1，1，2)模型预测了该矿山尾矿库2008年1-6月总排口的锌浓度。预测结果如表5所示。与2008年1-6月的实际监测值相比，误差在5%以内。因此，利用该模型对矿区重金属污染进行预测和分析是合理的，并可用于未来若干年的预测和分析。

表5模型对2008年1-6月尾矿库废水总排口Zn的预测效果检验

时间

原始值/(毫克/升)

估计值/(毫克/升)

相对误差/%

2008年1月

1.446

1.410911

2.4266

2008年2月

0.883

0.875686

0.8283

2008年3月

1.483

1.540904

-3.9050

2008年4月

3.401

3.557479

-4.6010

2008年5月

3.283

3.167384

3.5217

2008年6月

2.048

2.073795

-1.2600

第三，结论

ARIMA本身属于计量经济预测分析模型。由于该模型灵活、易操作，应用广泛，对研究矿区尾矿库总排口Zn污染时间序列具有良好的预测和分析效果。经验证，总体平均误差约为5%。

ARIMA模型能很好地拟合该矿区尾矿库废水总排放口锌污染的发展趋势。但由于锌浓度的变化受选矿诸多因素的影响和模型本身的局限性，只能在短期内进行预测。未来应该开发更有效的算法对其进行预测和分析，如系统动力学空之间的状态方程、Petri网、非线性科学等。

综上所述，时间序列ARIMA模型是一种理想的金属污染预测方法。利用ARIMA模型模拟矿山金属污染的变化规律具有一定的现实意义，不仅可以为地方政府部门和矿业管理部门对盲矿区污染进行管理和决策提供依据，也可以为国家对采矿造成的环境破坏进行管理和制定治理方案提供依据。

免责声明：本网部分内容来自互联网媒体、机构或其他网站的信息转载以及网友自行发布，并不意味着赞同其观点或证实其内容的真实性。本网所有信息仅供参考，不做交易和服务的根据。本网内容如有侵权或其它问题请及时告之，本网将及时修改或删除。凡以任何方式登录本网站或直接、间接使用本网站资料者，视为自愿接受本网站声明的约束。

我的煤炭网

首页

新闻
价格
供应
求购
企业
会展
百科
知道
视频
下载
VIP

基于模型的矿区重金属污染时间序列预测

相关内容