打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Fisher最优分割法在澄碧河水库汛期分期中的应用


(1.广西大学土木建筑工程学院,广西南宁530004;2.广西大学工程防灾与结构安全教育部重点实验室,广西南宁530004;3.广西大学广西防灾减灾与工程安全重点实验室,广西南宁530004)

摘 要:在深入分析澄碧河流域汛期变化特性的基础上,以澄碧河水库为例,选取暴雨日数、旬平均雨量、旬最大3天雨量、旬多年平均入库流量、年最大洪峰出现次数等5个指标,采用Fisher最优分割法进行汛期分期研究,将汛期分为前汛期、主汛期和后汛期3个时期。结果表明,Fisher最优分割法不仅能够考虑多个指标,而且能够有效避免常规方法在阈值选取和最优分期数目确定上存在主观性强的缺点;与之前对澄碧河水库分期的相关结果对比,该方法则更为客观科学,分期结果也更加合理可靠。

关键词:Fisher最优分割法;汛期分期;澄碧河水库

0 引 言

洪水资源作为水资源的重要组成部分,如何充分的利用,进而实现洪水资源化成为近些年研究的热点问题[1-3]。相比传统的“非此即彼”的汛期分期方法,科学合理地进行汛期分期研究具有十分重要的意义。目前,汛期分期主要研究方法有定性分析法、统计分析法和聚类分析法3大类。其中聚类分析以其较强的物理数学背景,充分的理论基础表现出明显优势。聚类分析法种类较多,如模糊集合分析法[4]、分形法[5]、变点分析法[6]、系统聚类法[7]、灰色定权聚类法[8]、投影寻踪法[9]等;但这些方法多少都存在着一些缺陷。模糊集合法和分形法只考虑单因子指标;变点分析法和系统聚类法虽可考虑多指标,但在变点个数和指标阈值确定方面存在较强的主观性;投影寻踪法在构造指标函数时存在一定差异,且这种差异会对分期计算结果产生较大影响。鉴于此,Fisher最优分割法在不改变汛期时序性的基础上,既能综合考虑汛期的多因子指标,且能科学地展现出分期数目变化对计算结果变化的影响趋势,从而确定最优的分期数目,表现出较强的优势。目前Fisher最优分割法已经广泛应用于农业、气象和地质灾害预报等领域[10-11]。因此,本文在相关研究的基础上,采用Fisher最优分割法对澄碧河水库进行汛期分期研究,并以此与相关的研究结果进行对比,以期达到合理分期的目的;同时也为了更好地利用洪水资源,实现洪水资源化,从而有效缓解水资源短缺问题提供决策参考。

1 Fisher最优分割法

1.1 基本原理

Fisher最优分割法属于有序聚类方法的一种,它能很好地保证样本序列的时序性,这和汛期的天然时序性相吻合。Fisher最优分割法的核心思想是使得分段后各段总的离差平方和最小,从而使样本各段内部差异最小,段与段之间差异最大[10]。若假设

表示样本容量为n,且被分成k段的有序样本
根据排列组合原理,等价于在n-1个空缺中插补k-1个元素,故共有
种分割法;因而肯定能寻找到若干种较优的分割结果。结合核心思想,再通过计算分段后各段总的离差平方和,可确定最小的那种分割即为最优分割结果。

1.2 具体分割步骤

(1)归一化数据。由于不同类型的数据存在数量级上的差异,因此会对结果产生不同程度的影响。为避免此影响,需将待分割的样本数据进行如下归一化处理


=(xij-xmin,j)/(xmax,j-xmin,j)

(1)

式中,m表示样本中每个元素的维数;n表示样本容量;

为归一化后的样本元素;xmax,jxmin,j为样本中第j个指标的最大值和最小值。

(2)定义分段直径。分段直径是反映分段内部差异程度的指标,差异越大,则直径越大;反之亦然。设样本分段后的某一分段为{xs,xs+1,…,xt},(t>s),则有

(2)

(3)

式中

表示该段的均值;D(i,j)为该段的直径。

(3)定义损失函数。设样本P(n,k)被分成k段,其中一种分段方式为G1={i1,i1+1,…,i2-1},G2={i2,i1+1,…,i3-1},…,Gk={ik,ik+1,…,n};1=i1i2<>ikn=ik+1-1,则损失函数为

(4)

故若已知nk的值,则最优分割为

L*[b(n,k)]=min

D(il,il+1-1)

(5)

与之相对应的分割点即为最优分割点。

(4)递推公式。根据文献[11],有序样本的最优分割总是建立在截断末尾子段的最优k-1分割的基础上的,且存在以下两个核心公式

L*[b(n,2)]=

{D(1,i-1)+D(i,n)}

(6)

L*[b(n,k)]=

{L*[b(i-1,k-1)]+D(i,n)}

(7)

(5)求解最优分割。由递推公式可知,若样本容量n和分割数k确定,则需求出使得损失函数L[b(n,k)]达到最小的分割点ik,即可确定ik的位置

L*[b(n,k)]=L*[b(ik-1,k-1)]+D(ik,n)

(8)

之后可得第k段分割为Gk={ik,ik+1,…,n},接着求得分割点ik-1,使得L[b(ik-1,k-1)]达到最小。即

L*[b(ik-1,k-1)]=L*[b(ik-1-1,
k-2)]+D(ik-1,ik-1)

(9)

从而得到第k-1段Gk-1={ik-1,ik-1+1,…,ik-1}。同理,可以相应求出每一段的最优分割结果。

(6)确定最优分割数目。根据分割结果绘制出损失函数随对应分割数目k变化而变化的趋势曲线图L*[b(n,k)]~k,曲线的拐弯处对应的分割数即为最优的分割数。于是可绘制出上述曲线的斜率差值图δ(k)~k,其表达式为

(10)

图达到最大值时,说明图L*[b(n,k)]~k到达拐点,而当
接近0时,说明损失函数趋于稳定,因此没有进一步划分的意义。

2 基于Fisher最优分割法的澄碧河水库汛期分期

1 汛期分期划分指标及归一化数据

序号时段暴雨日数指标归一旬平均雨量/mm指标归一旬最大3天雨量/mm指标归一旬多年平均入库流量/m3·s-1指标归一年最大洪峰出现次数指标归一14月上旬2000017000042400004700000000024月中旬902122430084123801736100130000034月下旬90212355021313501978600380000045月上旬14036447403501623025512800780000055月中旬2105765730464248043726402092025065月下旬340970790713133019348104180000076月上旬28078871606282601046364405753037586月中旬3209099310876254045079907246075096月下旬33093910391000369506961013093160750107月上旬3008488110738195403251067098370875117月中旬3108798110738219603771001091930375127月下旬3510009240868213903651083099820250138月上旬2807888730809512710001085100081000148月中旬2807887750696130701881069098550625158月下旬27075862905281780288801072610125169月上旬170455486036417470281652058310125179月中旬80182333018828950525465040320250189月下旬80182264010816202543150258000001910月上旬110273247008991301042650210000002010月中旬100242328018237807142530198303752110月下旬70152307015818530304198014500000

2.1 工程概况及指标选取

澄碧河水库位于广西百色市的右江支流澄碧河下游,总库容11.21亿m3,为大(1)型水利枢纽工程。澄碧河总长127 km,水库流域多年平均降水量1 560 mm,降雨年内分布较为不均,4月~9月降水量占全年降雨量的85%以上,而10月~次年3月降水量明显减少。澄碧河洪水主要源于降水,故本文选取的资料为1963年~2011年的逐日降水和实测入库径流资料,并选取反映汛期变化特征的暴雨日数、旬平均雨量、旬最大3天雨量、旬多年平均入库流量、年最大洪峰出现次数等5个指标作为分期的依据,具体见表1。

2.2 汛期分期计算步骤

步骤1: 归一化数据。根据1.2中(1)的方法对上述5个指标进行归一化处理,归一化后的数据见表1。

步骤2: 计算分段直径。根据式(2)(3),计算每一分段的直径D(i,j),其中i=1,2,…20;j=i+1,…,21。

步骤3:计算损失函数。根据损失函数的性质和两个核心公式可以计算出每一种分割情况下的损失函数值L*[b(n,k)]。计算先由L*[b(n,2)]开始,L*[b(n,2)]表示在容量为n的样本被分割为2段(k值)时的最小损失函数值。

步骤4:计算最优分割数。按照表2寻找最优k分割,并由式(10)确定δ(k)的值(见表2)。

2.3 最优分割数的确定

根据表2中的数据分别绘制L*[b(n,k)]~k曲线图和斜率差值图δ(k)~k(见图1)。

由图1可知,L*[b(n,k)]~k曲线图在k=3时处于明显的拐弯处,且斜率差值曲线在k=3时达到最大值。因此,样本最优分割数为3,对应分段结果为{1-5}{6-15}{16-21}。结果表明,澄碧河汛期分为3期时最合理。即前汛期4月上旬~5月中旬,主汛期5月下旬~8月下旬以及后汛期9月上旬~10月下旬。

2 最优分割结果

kL∗[b(n,k)]δ(k)最优分割结果27456{1-4}{5-21}332823420{1-5}{6-15}{16-21}425280219{1-4}{5-7}{8-15}{16-21}519930291{1-4}{5-7}{8-14}{15-16}{17-21}61749-0063{1-4}{5-7}{8-12}{13}{14-15}{16-21}714410004{1-4}{5-7}{8-10}{11-12}{13}{14-15}{16-21}811370134{1-4}{5-7}{8-10}{11-12}{13}{14}{15-16}{17-21}909670031{1-3}{4-5}{6-7}{8-10}{11-12}{13}{14}{15-16}{17-21}1008280032{1-3}{4-5}{6}{7}{8-10}{11-12}{13}{14}{15-16}{17-21}110720-0039{1-3}{4-5}{6-7}{8-10}{11-12}{13}{14}{15-16}{17-19}{20}{21}1205720008{1-3}{4-5}{6-7}{8-10}{11-12}{13}{14}{15-16}{17}{18-19}{20}{21}1304330033{1-3}{4-5}{6}{7}{8-10}{11-12}{13}{14}{15-16}{17}{18-19}{20}{21}1403270008{1}{2-4}{5}{6}{7}{8-10}{11-12}{13}{14}{15-16}{17}{18-19}{20}{21}1502290028{1}{2-4}{5}{6}{7}{8-9}{10}{11-12}{13}{14}{15-16}{17}{18-19}{20}{21}1601600010{1}{2-4}{5}{6}{7}{8-9}{10}{11-12}{13}{14}{15}{16}{17}{18-19}{20}{21}1701000012{1}{2-4}{5}{6}{7}{8}{9}{10}{11-12}{13}{14}{15}{16}{17}{18-19}{20}{21}1800530021{1}{2-3}{4}{5}{6}{7}{8}{9}{10}{11-12}{13}{14}{15}{16}{17}{18-19}{20}{21}1900260010{1}{2-3}{4}{5}{6}{7}{8}{9}{10}{11}{12}{13}{14}{15}{16}{17}{18-19}{20}{21}200009{1}{2-3}{4}{5}{6}{7}{8}{9}{10}{11}{12}{13}{14}{15}{16}{17}{18}{19}{20}{21}

图1 L*[b(n,k)]~k和 δ(k)~k曲线

2.4 对比分析

结合文献[12]相关研究成果,将不同研究方法确定的澄碧河汛期分期结果进行对比分析,具体(见表3)。由表3可知,Fisher最优分割法计算结果与数理统计法、模糊集合法、灰色定权聚类法计算结果基本一致。但数理统计法和模糊集合法只能考虑单因子指标影响,且前者在指标阈值确定,后者在隶属度阈值确定上都存在较强的主观性。灰色定权聚类法虽然能考虑多个因子指标,但在阈值确定上同样存在主观性,且聚类结果是否为最优解有待进一步商榷。Fisher最优分割法则是在考虑多因子指标的基础上,从数据本身出发,以其较强的数学背景优势,有效避免了主观确定相关阈值的问题,且能合理地确定最优的分割数目,故分段结果更为合理可靠。

3 不同研究方法结果对比

研究方法前汛期主汛期后汛期Fisher最优分割法41~520521~83191~1031数理统计法41~520521~83191~1031模糊集合法41~53161~83191~1031灰色定权聚类法41~53161~83191~1031

3 结 语

(1)本文采用Fisher最优分割法对澄碧河水库进行汛期分期研究,同时将汛期分期结果与以往研究结果进行对比分析。结果表明,Fisher最优分割法分期结果与以往研究结果基本一致,且其能有效避免在相关阈值选取和最优分期数目确定上的主观性,弥补了常规方法的不足。Fisher最优分割法结果也更加科学,为汛期分期研究提供了一种客观、合理、可靠的研究方法。

(2)Fisher最优分割法因其数学背景较强,故在计算步骤上难免会存在复杂繁琐的缺点。计算机恰好具有有效解决复杂繁琐问题的优势,因此很好地改善了这一缺点;从而使Fisher最优分割法变得高效、快捷、可操作性强。

(3)本文在选取反映汛期变化特征的指标时是按照各个指标权重相等考虑的;而各个指标对汛期变化的影响程度可能不同。建议在进一步的研究中,可以先通过权重分析对不同指标赋予相应权重,之后再进行最优分割计算研究。

参考文献:

[1]李致家, 董增川, 梁忠民, 等. 大流域洪水预报与洪水调度管理方法研究[J]. 水力发电, 2004, 30(1): 12- 15.

[2]刘攀, 郭生练, 王才君, 等. 水库汛限水位实时动态控制模型研究[J]. 水力发电, 2005, 31(1): 8- 11.

[3]周惠成, 张改红, 王本德. 基于防洪预报调度调整水库汛限水位的研究[J]. 水力发电, 2006, 32(5): 14- 17.

[4]莫崇勋, 刘方贵, 孙桂凯. 水库汛期模糊划分及其分期汛限水位的确定[J]. 水力发电, 2009, 35(8): 13- 14, 21.

[5]魏炜, 莫崇勋, 刘俐, 等. 流域降雨量分形方法在水库汛期分期中的应用[J]. 人民黄河, 2014(10): 39- 41.

[6]刘攀, 郭生练, 王才君, 等. 三峡水库汛期分期的变点分析方法研究[J]. 水文, 2005(01): 18- 23.

[7]高波, 刘克琳,王银堂,等. 系统聚类法在水库汛期分期中的应用[J]. 水利水电技术, 2005(06): 1- 5.

[8]蒋海艳, 莫崇勋, 魏炜, 等. 灰色定权聚类法在水库汛期分期中的应用[J]. 水力发电, 2012, 38(12): 8- 10 .

[9]陈曜, 王顺久. 基于投影寻踪的汛期分期探讨[J]. 水文, 2009(3): 16- 18.

[10]和宏伟, 张爱玲. Fisher最优分割法在云南地震分期中的应用[J]. 地震研究, 1994, 17(3): 231- 239.

[11]王艳. 最优分割算法的计算机程序实现与武汉市洪涝灾害预测[D]. 武汉: 华中师范大学, 2007.

[12]莫崇勋. 水库土石坝工程技术洪水分期调度关键技术及应用研究[M]. 北京: 科学出版社, 2014.

(责任编辑 陈 萍)

Application of Fisher Optimal Partition on Flood Season Staging in Chengbihe Reservoir

MO Chongxun1,2,3, WANG Dayang1,2,3, ZHU Xinrong1,2,3, RUAN Yuli1,2,3, MO Guiyan1,2,3, LIN Yitong1,2,3
(1. College of Civil Architectural Engineering, Guangxi University, Nanning 530004, Guangxi, China;2. Key Laboratory of Disaster Prevention and Structural Safety of Ministry of Education, Nanning 530004, Guangxi, China; 3. Guangxi Key Laboratory of Disaster Prevention and Engineering Safety, Nanning 530004, Guangxi, China)

Abstract:Taking Chengbihe Reservoir as a study example, five indicators of rainstorm days, ten-day mean rainfall, biggest three days rainfall in a period of ten days, ten-day average inflow for years and times of flood peak every year are introduced to calculate flood season of Chengbihe Reservoir by adopting Fisher optimal partition method based on the analysis of flood season characteristics of Chengbihe Basin. The flood season is divided three periods of pre-flood season, main-flood season and post-flood season. The results show that the Fisher optimal partition method can not only consider multiple indicators, but also can effectively avoid the subjectivity in the selection of threshold and optimal number of dividing. Comparing with the results of other study methods, the Fisher optimal partition method is more objective and scientific and the results are more reasonable and believable.

Key Words:Fisher optimal partition method; flood season staging; Chengbihe Reservoir

收稿日期:2016- 12- 08

基金项目:国家自然科学基金资助项目(51569003);广西自然科学基金资助项目(2015GXNSFAA139248);广西防灾减灾与工程安全重点实验室系统性研究项目(2014ZDX01);广西水利厅科技项目(201507);广西高等学校优秀中青年骨干教师培养工程项目(桂教人[2014]39号);广西研究生教育创新计划资助项目(YCSW2017052)

作者简介:莫崇勋(1974—),男(壮族),广西忻城人,教授,博士生导师,主要从事水文水资源研究(通讯作者).

中图分类号:TV697.13

文献标识码::A

文章编号::0559- 9342(2017)06- 0019- 04

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
多指标综合评价方法及权重系数的选择-医药英语-论文中心
数学建模及其算法概述
人工智能算法在图像处理中的应用
AI研习丨专题:免疫优化图像解译
功德无量的放生已经严重地变了味
究竟应该聚多少类?聚类分析
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服