气象站行业新闻

新闻中心

Service support

ARIMA模型是什么? O3浓度变化特征有哪些?

在阅读此文前,诚邀您请点点右上方的“关注”,既方便您进行讨论与分享,还能及时阅读最新内容,感谢您的支持。

伴随着城市化快速发展,我国城市环境污染问题日益严重,特别是大气环境污染,与极端高温、城市热岛效应叠加对城市居民生产、生活以及人体健康造成很大的影响。

大气污染呈现出从以往单一煤烟型污染向复合型污染转变、局地性向区域性拓展的态势。

以细粒子(PM2.5) 和臭氧(O3) 污染为主要特征的区域性和复合型大气污染问题日趋凸显。

近年来全国各地的地表臭氧浓度持续增长,多个城市(北京、上海、广州和成都)的近地面O3浓度的总体或季节变化呈现显著的上升趋势。

 

随着人们对臭氧重视程度的不断提高,围绕臭氧污染特征、成因分析以及和气象要素的关系研究及相关成果也日益增多。

也有研究从天气角度(针对臭氧日污染情况)分析了上海、武汉、四川和银川等地的臭氧相联系的环流分型及定量影响,均表明大气环流形势对臭氧污染具有重要的贡献。

另有研究者对臭氧预报方法和预报模型进行了研究,主要包括数值模式和统计方法。

其中,数值模式包括WRF/CAMx和WRF-Chem模式等。

统计方法以ARIMA时间序列分析模型为代表,对3~15d的臭氧浓度预报效果较为理想。

数值模式对基础数据、硬件平台和专业门槛等要求苛刻,模拟速度缓慢。

而ARIMA模型简单,可以根据有限的数据集建立精确的模型对其进行快速预测,已广泛用于环境、医学、交通和能源等领域的预测,均取得较好的效果。

近年来,支持向量机回归和XGBoost等机器学习方法也逐渐被应用于臭氧天气预报和浓度估算。

上述方法均取得一定效果,在预报应用中发挥了作用。

 

然而,现有研究大多是针对O3的一次污染过程或较短时间序列污染过程,建立的预报模型也多集中于月预报和15d以内的中短期预报。

虽有长时间序列O3污染趋势研究和变化特征研究,但利用较长时间序列的O3浓度和气象数据,从气候形势角度对O3污染的气候背景进行研究鲜见报道。

鉴于此,本文利用2006—2021年上海O3浓度日数据(选取日最大8h滑动平均值),以及同期地面观测的气象资料和高空大气环流数据,着眼于气候角度分析夏半年上海O3浓度异常情况相联系的大气环流背景,并加入气象因子作为外生变量,利用网格搜索法寻找最优模型,研究对ARIMA模型应用于O3浓度月预报的提升效果,以期为科学评价天气气候条件变化对O3污染发生的影响、提高污染性天气预报的准确率和合理控制、减少大气污染的危害提供科学依据。

 

材料与方法

数据资料

本文O3浓度数据来自上海市环境监测中心提供的普陀监测站(121°24′E,31°14′N)资料,时间序列为2006—2021年逐日数据。

气象资料来自于上海市气象信息与技术支持中心的宝山国家基本气象站(站号58362,121°27′E,31°24′N)逐日观测资料,统计时间段为2006—2021年,统计要素有地面层风速、风向、气温、太阳辐射、日照时数、云量、降水量和相对湿度等。

此外,文中的NCEP/NCAR再分析资料来自美国国家海洋和大气管理局(NOAA, https://www.esrl.noaa.gov/),时间段为2006—2021年,其中常年值时间段为1991—2020年,水平分辨率为0.25°×0.25°。

 

普陀监测站是上海市环境空气质量监测国控站点之一,位于上海市普陀区杏山路317号,周边主要是住宅、学校和公园等,O3浓度测定采用美国Thermo Fisher(赛默飞世尔)公司的Model 49i臭氧分析仪。

宝山气象站是国家基本气象站,位于上海市宝山区友谊路1888号,周边主要是住宅、公园和企业等。

宝山气象站和普陀监测站两地相距约18.5km。

O3缺测数据为44个,有效数据百分比为99.2%,气象要素缺测数据共4个,有效数据百分比接近100%,质控优良,数据完整性好。

缺测数据采用前一日和后一日的平均值补齐。

 

环境监测站和气象站位置示意

分析方法

ARIMA模型

时间序列分析方法采用经典的统计学模型ARIMA (p,d,q)模型[32],其全称为差分整合移动平均自回归模型(autoregressive integrated moving average model,ARIMA),其中p为自回归项数,d为使之成为平稳序列所做的差分次数(阶数),q为移动平均项数。

计算公式如下:

 

(1)

式中,yt表示当前值,μ表示常数项,p表示自回归阶数,q表示移动平均阶数,φi和θi分别表示AR和MA的系数,ϵt表示误差。

季节性ARIMA模型是在ARIMA模型中引入季节性项(seasonal autoregressive integrated moving-average),记为SARIMA (p,d,q)(P,D,Q)s,如再引入外生变量,则是具有外生回归量的季节性整合移动平均自回归模型(seasonal autoregressive integrated moving-average with exogenous regressors),记为SARIMAX (p,d,q)(P,D,Q)s,其中p、d和q表示非季节部分模型参数,P、D和Q表示季节部分模型参数,s表示季节性周期。

数据的平稳性单位根检验用增广迪基-福勒检验(augmented dickey-fuller test,ADF)。

本文中时间序列分析利用Python语言的statsmodels包完成。

 

均方根误差

模型验证用均方根误差(root mean squared error,RMSE),进行模型拟合值和观测值之间对比,RMSE值越小,表明拟合精度越高,模型越好。

RMSE计算式为:

 

(2)

式中,OBS表示观测值,SIM表示拟合值,n表示样本数。

结果与分析

O3浓度变化特征

1月变化特征

利用时间序列分析方法对O3浓度月变化趋势进行分析,结果见下面,其中滑动平均值和滑动标准差的滑动窗口值为12。

2006—2021年间,上海O3浓度月平均值具有明显的周期性,一年之中呈现中间月份高(4—9月),两头低形态,滑动平均值呈波动式增大趋势,滑动标准差基本趋于常数。

 

2006—2021年上海地区O3浓度月平均值变化趋势

年变化特征

2006—2021年间,上海O3浓度年平均值呈现波动式增加趋势,2017年最高(117.7µg·m-3),2006年最低(62.0µg·m-3);夏半年(4—9月)O3浓度平均值也是呈现波动式增加趋势,其中2017年最高(147.5µg·m-3),2006年最低(77.3µg·m-3)。

夏半年和全年的O3浓度平均值相关系数(R)为0.985,夏半年O3浓度平均值都远高于全年浓度平均值,最多高出达36.2%,进一步表明全年O3分布集中在夏半年。

进一步从O3浓度距平百分率[(实测值-同期历史均值)/同期历史均值×100%,下同分析,表明2006—2012年和2013—2021年分别为O3浓度偏低和偏高年份。

 

2006—2021年上海地区全年和夏半年O3浓度年变化及距平百分率

(a)O3浓度年变化,(b)距平百分率

夏半年O3污染的总体气候背景

对夏半年O3浓度偏高年份(2013—2021年)、偏低年份(2006—2012年)、最高年份(2017年)和最低年份(2006年)的气象条件分析结果见下面,总体上,O3浓度偏高年份伴随着污染日数偏多,平均风速偏小,小风(≤1.5m•s-1)日数偏多,低云量<20%日数偏多,高温日数偏多,太阳直接辐射量偏高,日照时数偏多。

O3浓度偏高、偏低、最高和最低年份气象条件对比

项目

偏高年份(2013—2021年)

偏低年份(2006—2012年)

最高年份(2017年)

最低年份(2006年)

16a平均

浓度/µg•m-3

125.6

95.0

147.5

77.3

112.2

污染日数/d

35.4

16.6

66

6

27.2

平均风速/m•s-1

2.6

3.1

2.5

3.4

2.8

小风日数/d

19.4

4.4

23

4

12.9

低云量<20%日数/d

85.6

74.6

94

66

80.8

高温日数/d

20.7

17.3

31

19

19.2

太阳直接辐射/WJ•m-2

日照时数/h

08:00—20:00降水量/mm

相对湿度/%

1643.7

969.8

523.8

74.8

1428.3

929.8

481.4

70.6

1720.8

1009.3

529.3

71.1

1465.1

985.7

357.3

69.2

1486.2

952.3

505.2

73.0

风是影响大气污染物扩散、稀释的很重要的一个因子,风速影响污染物在大气中的扩散和区域性迁移。

显示,2006—2021年夏半年平均风速呈现减少趋势,尤其是2014年以后减少比较明显,各年夏半年O3浓度和风速呈现负相关(R=-0.826),通过0.01显著性水平检验。

静稳天气往往导致污染加重,而O3浓度偏高年份的静风(C)出现频率为2.9%,是偏低年份(1.0%)的近3倍。

各年夏半年静风出现频率和O3浓度呈现正相关(R=0.836),通过0.01显著性水平检验。

 

2006—2021年间,低云量<20%日数呈增加趋势,和O3浓度正相关(R=0.724),通过0.01显著性水平检验;日最高气温≥35℃的高温日数变化趋势不明显,和O3浓度正相关(R=0.264);太阳直接辐射和日照时数都呈波动式增长趋势,和O3浓度正相关(R分别为0.602和0.265);08:00—20:00降水和相对湿度都呈波动式增长趋势,和O3浓度正相关(R分别为0.186和0.413)。

综上所述,夏半年O3浓度与平均风速负相关,与静风出现频率、低云量<20%日数、太阳直接辐射、高温日数、日照时数、08:00—20:00降水量和相对湿度成正比。

相较而言,平均风速、静风出现频率、低云量<20%的天数以及太阳直接辐射和O3浓度的相关关系更为显著,前3个通过0.01显著性水平检验,后1个通过0.05显著性水平检验。

 

2006—2021年上海地区夏半年O3浓度和气象因子变化

阴影表示各要素拟合曲线的置信区间

夏半年O3浓度及气象要素相关系数1)

O3浓度

平均

风速

低云量<20%日数

高温

日数

太阳直接辐射

日照

时数

平均相对湿度

08:00—20:00

降水

O3浓度

1

平均风速

-0.826**

1

低云量<20%日数

0.724**

-0.737

1

高温日数

0.265

0.099

0.342

1

太阳直接辐射

日照时数

平均相对湿度

08:00-20:00降水

0.602*

0.265

0.413

0.186

-0.271

-0.002

-0.754

-0.438

0.468

0.420

0.369

0.552

0.534

0.544

-0.506

-0.102

1

0.841

0.019

-0.153

1

-0.098

-0.002

1

0.445

1

1)*为P<0.05,**为P<0.01

Wu X C, Chen B, Wen T X, et al. Concentrations and chemical compositions of O3 during hazy and non-hazy days in Beijing[J]. Journal of Environmental Sciences, 2020, 87: 1-9.

Li K, Jacob D J, Shen L, et al. Increases in surface ozone pollution in China from 2013 to 2019: anthropogenic and meteorological influences[J]. Atmospheric Chemistry and Physics,2020,20(19): 11423-11433.

来源:编辑:author发布时间:2024-03-16