打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
城轨新线客流成长期进出站量短时预测研究

城市轨道交通具有准时、速达、大运量等特性,目前已成为缓解城市交通拥堵的重要方式之一。随着城市轨道交通网络规模的持续扩大,新线不断建设并投入运营,客流变化特征愈加复杂。在此过程中,准确把握新线开通后的进出站客流态势和演变规律,是确保相关部门制定有效运营管理措施、保障新线正常运营的关键。然而,在轨道交通成网运营背景下,新线开通后存在一定时间的客流成长期,在此期间由于乘客对新线的使用习惯尚未固定,新线站点的客流吸引范围和吸引对象尚未稳定,客流处于成长阶段,其变化趋势具有较为明显的增长性和波动性,导致原有针对既有线网的预测模式并不适用,预测结果与实际情况相差甚远。因此,新线客流预测是当前城轨运营管理中亟待研究的问题之一。

我一下愣住了。这还真不好回答。想了一下,我就把事情原委跟她说了。听着听着,婆婆就落泪了,说:“你这个娘真不简单。你往西走六七里,西山有个骆驼坳,他们在那儿。”她出来指了下方向,又说:“那里险着呢。方圆二三里,男的见了就开枪打死,女的见了就掳进去糟蹋。这拢岸的人啊,冇得哪个敢去那儿,你要当心呵。”

目前已有许多城轨新线客流预测相关研究。在全天日客流预测方面,赵路敏等[1]结合线网客流变化的关键因素,提出了利用新线可研和现有站间客流数据来预测新线客流的方法。光志瑞[2]基于站点的土地利用和可达性分析,建立了新线开通初期新站和既有站进出站量预测模型。程涛等[3]基于既有客流的变化规律,根据标定车站客流与土地利用、到离站交通距离与地铁车站选择、合理轨道乘距等数学模型,提出了新线开通初期客运量、断面客流量的预测方法。蔡昌俊等[4]基于刷卡数据统计获得的集计客流数据,依据行为分析理论,建立了新线开通初期城轨站间客流量分布预测模型。姚恩建等[5]使用站点可达性指标定量分析了新线进出站客流的诱增效果,对新线的潜在客流进行了评估。以上研究对象均为日客流,不能够对日内的短时客流变化进行预测。在短时客流预测方面,国内外已有大量针对既有线网客流的预测方法,包括时间序列[6-8]、卡尔曼滤波[9-10]、支持向量机[11-12]、神经网络[13]等方法,但其预测原理均基于历史数据,无法应用于新线短时客流预测。在新线短时客流预测方面,姚恩建等[14]针对新站缺乏历史数据的问题,提出了基于同类既有站匹配的新站历史数据库构建方法,并实现了对新站实时进出站量的预测,但其中并未充分考虑客流变化趋势和预测效率,难以保证预测的有效性和实时性。

综上,现有新线客流预测相关研究主要为全天日客流预测,或新线开通影响下既有站点的客流预测,较少有研究针对新线开通后自身的短时客流进行深入分析,缺少新线客流成长期小粒度、高精度、高效率的进出站量预测方法。然而,新线站点在客流成长期内的进出站量变化不稳定,且缺少历史客流数据,既有的短时客流预测方法无法满足其预测精度和实时计算效率要求,直接影响新线开通后的实时监测与客流评估,导致城轨运营组织不合理的后果。基于此,本文针对新线客流预测缺乏历史数据方面的问题,通过对新线站点进出站客流变化规律的分析,提出基于改进模糊C均值聚类(Fuzzy C-Means,FCM)算法的站点类型划分方法,通过匹配同类既有站点历史数据来对新线站点的历史数据库进行构建;针对预测算法实时性和预测精度方面的问题,基于趋势距离和多元统计回归对K近邻(K-Nearest Neighbor,KNN)算法进行改进,提出新线客流成长期进出站量短时预测方法,以期提高新线进出站量短时预测的计算效率和预测精度,为新线精细化运营管理的强化和改善提供决策支持。

核心素养指的是学生应具备的适应终身发展和社会发展需要的必备品格和关键能力。它包含三层构架:一是以基础知识和基本技能为核心,二是以解决问题过程中所获得的基本方法为核心,三是在学习中获得的认识世界和改造世界的世界观和方法论。具体对于小学英语来说,所谓的核心素养就是学生在学习小学英语过程中获得的知识与技能、过程与方法、情感态度与价值观三方面的综合表现,即小学英语教学三维目标。

1 新线站点客流成长期进出站量变化规律分析

1.1 新线站点客流成长特征

新线站点客流成长期与稳定期的客流变化规律存在较大差异,为探究新线站点的客流成长特征,挑选广州地铁2015年12月28日开通的燕岗、鹤洞、沙涌站以及2015年1月28日初开通的一德路站为例,对新线开通年和次年的进出站客流变化趋势进行对比,各站进出站开通年、次年的客流日变化系数(其值为日客流量与年平均日客流量的比值)及拟合得到的趋势线见图1。由图1可以看出,与次年相比,开通年的客流增长率相对较高、波动性相对较强,该特性也同样存在于其他客流成长期的新线站点,因此新站客流成长期与稳定期客流特征差异性较为明显。

1.2 基于土地利用性质的新线站点客流趋势相似性分析

对于土地利用性质相似的站点,其客流变化趋势也具有相似性[15]。以广州地铁进出站客流为例,挑选2017年3月15日(周三)新线站点员岗、东平、世纪莲、高塘石的进出站量数据,与土地利用性质分别匹配的2017年3月8日(周三)既有站点大学城南、汉溪长隆、季华园、长湴的进出站量数据进行比较,二者的进出站量分时系数(各时段实际客流量与是日平均客流量比值)变化趋势对比见图2,可以看出各新站与其匹配的既有站客流变化趋势之间具有较强的相似性。该相似性在图中以外的其他各新站站点与既有站之间也同样存在,因此,针对新线站点客流预测中缺少历史数据的问题,可通过基于趋势相似性的站点类型划分、匹配同类既有站点数据解决。

在数学教学过程中,教师设计的问题若不能针对不同层次的学生,将可能导致学生的发展不均衡,导致学习成绩较弱的学生无法进步,成绩较好的学生得不到提高。因此,教师在设计练习题的过程中要注重层次性。教师可以将学生分成不同的层次,如:优、中、差三种层级,设计习题要从易到难,安排不同层次的练习。首先是基础练习,主要针对基础较弱的学生;然后是综合练习,让学生通过小组合作进行解决,培养学生的团队意识,并且可以让不同层次的学生进行交流,增强学生的综合能力;最后就是拓展性问题,让基础较好的学生对问题进行深入探讨,激发学生的思维能力。

2 基于站点聚类的新线站点历史数据库构建方法

城轨新线站点客流成长期缺乏历史客流数据作为未来短时进出站量预测的参考依据,使得相关预测方法难以直接应用。基于前文对新线站点与既有站点间客流变化趋势的相似性分析,通过站点类别的划分来分析新线站点与既有站点客流之间的关系,并基于同类既有站点进出站量历史数据来构建新线站点客流预测过程中所需的历史数据库。

2.1 基于改进模糊C均值聚类的站点类型划分方法

基于改进FCM算法对站点类型进行划分,站点短时进出站客流趋势变化特征主要由早高峰、晚高峰、平峰3个时段的进出站量大小决定,因此在聚类指标方面,使用3个时段的进出站量小时系数(其值为小时内客流量与日平均小时客流量的比值)作为趋势变化指标。在聚类算法方面,已有相关研究使用传统FCM算法作为站点分类方法[14]。传统FCM算法能够基于聚类指标的相似度对站点类型进行合理的划分,但其对初始聚类中心敏感,迭代计算目标函数值时容易陷入局部最优解[16],而由于城轨站点分类数、各类别客流特征的不确定性,难以在算法初始确定出较为合理的聚类中心,使用传统FCM算法无法保证最终结果的最优性。因此本文使用一种将启发式思想融入传统FCM的改进算法,该改进算法在传统FCM算法的寻优过程中,每次迭代时使用遗传算法和模拟退火算法中的启发式思想随机更新解集[17],该算法的相关应用研究表明该算法能够使迭代过程跳出局部最优并且加快速度向全局最优解靠近[18-19]。站点类型划分操作流程如下:首先,准备聚类指标数据,并对目标分类数的范围进行确定;其次,使用改进FCM算法对取值范围内的所有分类数进行循环计算,得出所有分类数的站点分类方案;最后,对各分类方案的有效性指标进行计算并比较,确定最优的站点分类方案。

为对站点类型划分方法的改进效果进行分析,以广州地铁为例分别使用传统FCM算法和改进FCM算法进行站点分类,对二者目标函数值的变化进行对比。以2016年10月17日至2016年12月25日期间10个周的工作日历史数据作为数据源、对所有郊区站点进行分类数为4的类型划分为例,其算法寻优过程见图3。其中传统FCM算法在第101次迭代得到了最优目标函数值5 652,之后便一直维持在该数值上;而改进FCM算法通过启发式思想,不断探寻可能存在最优解,在第92、167次迭代时摆脱了局部最优解,最终得到的目标函数值为5 034,提高了最终站点分类方案的最优性。

站点分类方案作为新站历史数据库构建的重要依据,对预测精度有着直接的影响,因此需针对不同分类方案的有效性进行检验和比较,选取最优方案。目前已有的聚类有效性指标(Cluster Validity Index,CVI)中,按其各自特征可分为以下3类:基于数据几何结构的有效性指标、基于隶属度的有效性指标、综合有效性指标[17]。在本文中,由于客流的趋势性因素符合聚类算法中的几何判别特征,而隶属度则能够对不同站点与聚类中心的差异定量化描述,因此为对各分类有效性特征进行较为全面地评判,所选取的有效性指标将涵盖以上3类指标。本文选取的聚类有效性判别指标情况见表1,通过不同站点分类方案之间各指标的比较可对其优劣性进行评判,表中相关性表示有效性指标与聚类有效性的相关性。

表1 站点分类方案有效性判别指标

指标类型指标名称变量符号相关性基于数据几何结构的有效性指标DunnIc1正相关Calinski-HarabaszIc2正相关基于隶属度的有效性指标划分熵(PartitionEntropy)Ic3负相关划分系数(PartitionCoefficient)Ic4正相关综合有效性指标Fukuyama-SugenoIc5负相关Xie-BeniIc6负相关Pakhira-BandyopadhyayIc7负相关重叠系数(OverlappingCoefficient)Ic8正相关

上述指标中包含正相关和负相关指标,为直观对比各分类方案的有效性,通过式(1)对各有效性指标进行调整统一和标准化,将所有指标均调整为范围为[0,1]内的负相关指标。

(1)

式中:

为第i个有效性指标分类数为c的调整后指标,该指标为负相关指标;Ici为第i个有效性指标分类数为c的原始指标。

若各指标结果对最优分类方案的判别结果总体一致,则判定该方案为最优方案;否则,对判别结果出现差异的原因进行分析,若分类不合理,则重新选取数据集进行聚类,若差异产生原因合理,则通过计算其加权有效性指标(Weighted Summation type Cluster Validity Index,WSCVI)进一步比较,加权有效性指标为

(2)

式中:Ic为分类数c的加权有效性指标,该指标为负相关指标;ωi为第i个指标

的权重,表示其在Ic中的重要度,0≤ωi≤1且

如图1所示,水源从进水管进入,由于水流量较大,当水流进到筒体冲击筒体底板再反冲到过滤钢板,这样就形成翻滚式[4-5]的水流,形成“旋涡”式的水源,由于水流翻滚不断,过滤钢板倾斜放置,翻滚水流不断“冲洗”过滤钢板,这样就形成了一个水流内循环,起到自我清洗过滤钢板作用,并且水中的杂质,比如树叶、树枝等杂质基本都漂浮在水表面,过滤板上部三分之一没开孔就阻止了杂物通过过滤钢板,由于有2层过滤板并且错开布孔,这也进一步拦截了杂质,当清水泵停止运行时,定期打开排污阀,打开进水管闸阀,筒内杂物顺着水流全部排出[6]。

对于新线站点而言,由于其客流成长期间历史数据较少,对其站点类型进行确定时需要首先对其站点周边土地利用情况、可行性研究报告进行评估,从而将该新线站点归到土地利用性质相近的站点类别中,实现对新线站点类型的确定。

2.2 历史数据库的构建

由于新线站点的历史数据较少,无法构建其进出站客流短时预测过程中所需完整的历史数据库,难以保证预测结果的精度。针对这一问题,提出新线站点的历史数据库构建方法,一方面,将既有的少量新线站点历史数据加入历史数据库;另一方面,基于前文所得的站点分类方案,根据新线站点和同类既有站点的站点类型进行匹配,将同类站点的历史数据作为新站的历史数据,构建新线站点进出站量预测所需的历史数据库。具体构建方法如下。

首先,构建新线站点x已产生的实际进出站量历史数据库

其中,T1为新线开通日到目标预测日前一天之间的时间段。较同类既有站点的客流数据而言,新线站点的实际客流数据更能够体现其客流变化规律,因此需逐日更新该部分历史数据库。

其次,建立新线站点与既有站点之间的匹配关系,以描述新线站点的预测日期类型、位置类型、站点类型与既有站点的映射关系。对于新线站点x,有

Sx=f(U,Lx,Cx)

(3)

式中:Sx为新线站点x匹配得到的相似既有站点集;U为预测日期类型(周次);Lx为新线站点x的位置类型(市区、郊区);Cx为新线站点x的站点类型。

最后,确定参考同类历史数据时间跨度T2,构建参考同类既有站点的历史数据库

并合并为最终历史数据库Dx,见图4。历史数据库的构成为

(4)

3 基于改进K近邻算法的新线站点客流成长期进出站量短时预测方法

城轨新线站点客流成长期内短时进出站量存在不同幅度的波动,且缺乏历史数据的支撑,即使可参考同类既有站点的历史数据,但若没有合理的匹配机制和预测算法,则无法保证预测效率和精度。

KNN算法作为一种非参数回归方法,能够针对给定测试实例,基于距离度量找出训练集中与其最靠近的K个实例点,并基于K个最近邻的信息来进行预测。目前,已有研究提出基于KNN算法的短时交通流预测方法[14],该算法能够基于当日实际发生的时段客流数据特征来确定状态向量,寻找与预测目标相匹配的K个历史日客流数据作为K近邻数据,并将其作为预测算法的输入,实现对目标时段客流的预测。但由于其历史数据库中数据量庞大,既有算法中近邻匹配步骤耗时较长,计算效率有待提高;在预测原理方面完全基于历史数据,没有充分考虑历史数据与预测目标之间的差异性,且没有考虑未知因素对短时客流的影响,其预测精度有待增加。

本部分预测方法主要分为状态向量确定、近邻匹配、目标客流预测3个步骤,见图5。其中,在近邻匹配机制中,提出趋势距离的概念和计算方法,用以提高既有机制的匹配效率;在目标客流预测过程中,结合多元统计回归原理,消除预测目标与近邻数据之间的差异性,改进传统KNN算法,以期进一步提高预测精度。

3.1 状态向量的确定

各时段的短时客流均可看作独立的时间序列,在各序列中连续若干时段的客流数据间具有较强的相关性,因此选取与目标预测时段客流相关性最强的若干相邻时段客流作为状态向量。时段个数m可通过计算q阶自相关系数rq来确定,计算式为

(5)

(6)

式中:P(j)为时间序列中第j个时段客流量;

n个客流量均值;P(j+q)为滞后q个时段的客流量;n为时段个数。

对于给定的自相关系数阈值M,当rqM时,可认为时间序列中间隔q个时段的2个值相关性较强。为使状态向量中尽多地包含与预测时段相关的客流时段,取m=max{q|rqM},并由预测时段前m个时段客流构成状态向量。

3.2 基于趋势距离的近邻匹配机制

目前大多数研究通常使用欧式距离来衡量预测目标与历史数据之间的匹配度,但由于历史数据库中数据量较为庞大,在实际短时客流预测中的近邻匹配计算过程会耗费大部分时间,难以保证预测结果的时效性。而本文中对于近邻的确定仅需对各近邻与预测目标的距离进行比较,不需其具体距离值具有很高的精确度。因此,为了节约近邻匹配的搜索时间,本文提出趋势距离的概念和计算方法,用以替代欧式距离作为近邻匹配机制的判定指标。趋势距离的计算方法为

通过采用折线滑动法分别计算滑坡各剖面的稳定系数及剩余下滑力,可以得出如下结论:滑坡在自重工况下,处于稳定-基本稳定状态,与宏观分析结果一致;在暴雨工况下,滑坡处于基本稳定-不稳定状态。

(7)

Suv=|P0v-Puv|

(8)

式中:Su为预测目标与第u个近邻数据之间的趋势距离;Suv为预测目标与第u个近邻历史数据之间第v时段进出站量的趋势差;P0vPuv分别为预测目标、历史数据的进出站量分时系数。

在计算效率方面,趋势距离的乘除法计算量仅为1,而欧式距离的乘除法计算量为m+1,对于每次预测流程中的近邻匹配步骤而言,需计算的近邻数量为m(T1+T2)。因此,与欧式距离相比,趋势距离的使用够在保证匹配精度的前提下,减少m2(T1+T2)的乘除法计算量,大幅度提高计算效率。

对于近邻数K的确定,目前大多数研究通过对不同K值下的样本测试结果进行误差比较,取最优作为K的固定值。为消除不同变化特征的进出站客流匹配偏差,本文在预测过程中将实时动态计算不同时段对应K值,并采用交叉验证法来确定最优K值。

3.3 基于多元统计回归的改进算法

针对基于K近邻的预测算法,目前通常的方式为对近邻数据依据时间序列加权平均来计算预测值[20]。然而,本文站点类型划分时采用的指标为客流分时系数而非客流量,对于新线站点而言,虽与同类站点在客流变化趋势上具有相似性,但无法保证具体客流大小一致。以2017年3月15日(周三)的新线站点长湴站以及其2017年3月8日(周三)同类既有站点高塘石的进站客流为例,新线站点与既有站点进站量分时系数的变化趋势对比见图6,由图6可见,二者的进站量分时系数虽一致性较强,但进站量之间的差异却很大。因此若直接使用同类既有站点的数据进行简单平均计算进行预测,会造成较大的预测偏差。

针对上述问题,本部分将多元统计回归应用于KNN算法中,定量刻画预测目标与近邻数据之间关系。在预测效率方面,多元统计回归对比其他预测方法具有较高的计算效率,对短时客流预测的时效性影响较小;在预测原理方面,多元统计回归能够通过回归参数的估计来确定不同近邻的权重系数,建立预测目标与近邻数据之间的关系,消除二者之间的差异性。因此,本部分在传统KNN算法的基础上结合多元统计回归的特点提出改进预测算法。具体改进方法为:针对状态向量中的元素,以K个近邻对应的数据作为自变量,目标预测日对应的数据作为因变量,建立多元统计回归关系,并进行参数估计。多元统计回归关系为

Q(i)=Q·a+b+ε

(9)

Q=[Q1(i),Q2(i),…,QK(i)]

(10)

a=(a1,a2,…,aK)T

原始“偶像崇拜”是对被赋予神灵意味的象征物的崇拜;新型“偶像崇拜”多是对人的崇拜。随着社会的发展,“偶像崇拜者”已经被“追星族”、“粉丝”等概念代替。本文所探讨的“偶像崇拜”主要是因“明星崇拜”出现的粉丝现象,以及粉丝社群对粉丝形象的重塑。

(11)

式中:Q(i)为预测日第i时段的进、出站量;Q为各近邻第i时段进出站量组成的向量;a为各近邻回归参数组成的向量;b为常数项;ε为随机误差项。

4 案例分析

以广州地铁2017年开通新线站点的5 min粒度进出站客流为例,对预测方法的有效性进行检验。广州地铁于2016年12月28日开通了6号线二期、7号线一期和广佛线二期共17个新站,截至2017年6月27日,全网共157个站点,具体线路和站点分布见图7。根据预测日期类型和站点位置类型,可将站点客流为工作日市区、周六日市区、工作日郊区、周六日郊区4类。由于此次新开通站点均为郊区站点,本部分将以工作日郊区为例进行分析,其中包括既有站点59个,新线站点17个。根据相关方法对本例中各新线站点客流成长期的界定,其客流成长期跨度均在3个月以内,因此,将2016年12月28日至2017年3月31日之间的日期作为目标预测日期,并将预测结果与实际数据进行对比,来对预测方法的精度进行检验。

4.1 站点类型的确定

本部分使用改进FCM算法对郊区59个既有站点的工作日站点类型进行了划分。为保证最终站点分类方案与真实情况的契合程度,以新线开通日期最接近的2016年10月1日至2016年12月25日期间所有郊区站点10个周中工作日进站数据作为算法的数据源,分别对分类数c在[2,10]之间的站点分类方案进行确定,并使用8种有效性指标调整后的

对各站点分类方案进行评判。由于
为负相关指标,因此其数值越小,表示站点分类方案越理想,不同分类数下的各有效性指标变化趋势见图8。可以看出,当c=4时,除
外,其它有效性指标均出现局部极小值,因此可以初步判断,当分类数为4时,站点分类效果最佳。

为进一步对最佳分类方案进行判定,接下来对各分类方案的加权有效性指标Ic进行计算,取所有权重系数均相等、判别阈值IT=0.2,各分类方案的Ir计算结果见表2。可以看出,I4=0.09为最小值,因此c=4为最佳分类数。

表2 各站点分类方案的加权有效性指标Ic

分类数cIc分类数cIc分类数cIc20.1550.3880.8030.2860.3290.6240.0970.55100.81

该分类方案的聚类中心见表3,依据聚类中心中的各指标特点可将各类型依次定义为居住类、办公类、枢纽类、综合类。其中,居住类早高峰进站、晚高峰出站系数较大,办公类早高峰出站、晚高峰进站系数较大,枢纽类各系数均处于较高水平,综合类系数无明显特征。

二是当好行为上的“方向标”。喊破嗓子不如干出样子,对于一线员工而言,身边的榜样往往比“纸上”“墙上”“电视上”的标杆典型更具有感染力。为促进班组舆情疏导员发挥表率示范作用,各基层队、站以“标准上高一档、管理上严一格、作风上紧一扣”为导向,对班组舆情疏导员队伍进行严格管理,实行“任期制”“考评制”和“淘汰制”,半年为一个任期,每月通过干部评价、员工评议、业绩评定相结合的方式,对每名班组舆情疏导员作风、形象、能力、素质、作用发挥等各方面进行综合考核,月度成绩累加得出任期总评分,对前三名进行表彰奖励和经验推广,淘汰末三名,由支委会重新选设。

表3 工作日郊区站点聚类中心(小时系数)

类型早高峰进站早高峰出站平峰进站平峰出站晚高峰进站晚高峰出站居住0.190.060.150.100.130.21办公0.070.130.140.150.210.09枢纽0.140.180.150.130.130.16综合0.090.100.140.140.180.16

对于本例中的新线站点,根据周边土地利用情况、可行性研究报告确定其工作日的站点类型,见表4。

表4 工作日郊区新线站点分类情况

类型站点名称居住世纪莲、澜石、香雪、钟村、龙洞办公新城东、萝岗、谢村、板桥枢纽东平、苏元、南村万博、高塘石、金峰、暹岗综合黄陂、员岗

4.2 客流预测及精度分析

选取2016年12月28日至2017年3月31日期间所有工作日作为目标预测日,对预测方法的各个步骤进行实现。首先对17个新线站点的工作日历史数据库进行构建,由于本案例中既有站点数据量充足,且站点的同周次进出站客流变化规律相似,本部分将对每个新站周一至周五5个周次分别构建历史数据库。

那天下午三点光景,麦村妇女都在村西头的棉花林里摘烂铃子。昨晚赶过一场雷阵雨,今天又被猛太阳一顿暴晒,棉花林里热得像只蒸笼,妇女们都跟从河里捞出来似的,身上没一处是干的,连头发也湿得像雨天的鸡毛。远远的,就看见一个人从白晃晃的阳光里跑来,像一条不长记性的狗,好好的田埂不走,偏在花地里穿来穿去,直奔她们劳动的棉花林。一会儿,他拐上棉花林前的田埂,才看清楚他左腋下夹着一把雨伞,伞柄在前,柄上系着白素;大汗淋漓的脸盘在阳光里油亮油亮的,像打了蜡一样;两只大小不一的红眼睛你抢我夺地眨巴着,令他长长的马脸显得十分诡异。

通过对所有目标预测过程的执行,统计结果显示,进、出站客流短时预测的平均执行时间分别为29.12、26.84 s,同等计算机配置下的传统KNN方法平均执行时间为45.28、39.61 s,计算效率较传统KNN方法分别增加了35.68%、32.23%。

除了以能够吸引中小企业且纯粹根据应用制定的价格提供计算容量的大型数据中心外,目前还有许多其他合作伙伴加入进来,包括研究机构、软件制造商和服务商,专门面向行业提供对相应模拟技术进行访问的模拟仿真,在国家和州一级也有各种提供财政补贴的推广计划,此外还有一个关于建立基于网络的平台的欧盟项目“Fortissimo”,该项目旨在让中小企业更加容易地使用高性能计算机进行模拟,从而提高其竞争力,Sicos BW公司可以帮助企业纵览全局并找到合适的方案。

本次采集数据中共包含27万个项目的详细数据.其中通过抓取follower数排名前1000人的项目,共得到约32000条记录.随后通过在这1000名开发者的关注者群体中随机采样,抽取了约23万多个项目.星标数分布情况如表1所示.可见此次选取的项目可以较好地反映出github社区中较活跃项目的情况.

对于预测方法精度,本文采用平均绝对误差EMAE和平均绝对百分比误差EMAPE对其进行检验,定义为

(12)

EMAPE=1/T×

(13)

式中:t为5 min粒度预测时段;T为总预测时段个数;y(t)为时段t进(出)站量真实值;a(t)为时段t进(出)站量预测值。

预测结果见表5。

[7]Vgl.Quack,MünchenerKommentar zumBGB,4.Auflage,München:Verlag C.H.Beck,2004,§932 Gutglubiger Erwerb vom Nichtberechtigten,Rn.59.

表5 广州地铁2016年12月28日至2017年3月31日期间新线站点工作日5 min粒度进出站客流平均预测误差

预测指标预测日期 EMAE/人次 EMAPE/%世纪莲澜石…员岗世纪莲澜石…员岗进站量2016-12-283(4)1(3)…3(3)17.91(23.88)10.77(32.31)…9.36(9.25)2016-12-293(4)0(1)…4(5)18.58(24.77)0.00(9.43)…10.00(11.93)︙︙︙︙︙︙︙2017-03-312(2)1(0)…3(2)14.22(14.22)12.55(0.00)…07.18(5.34)均值3(5)1(3)…2(4)11.64(21.45)07.36(14.32)…08.25(8.38)2(4)9.08(14.72)出站量2016-12-282(3)0(1)…3(4)16.67(25.00)0.00(7.70)…21.43(28.57)2016-12-293(3)2(3)…3(5)20.00(20.00)11.76(17.65)…15.79(26.32)︙︙︙︙︙︙︙2017-03-313(4)3(3)…2(4)12.00(16.00)13.64(13.64)…7.41(14.82)均值3(4)2(3)…2(4)13.34(20.08)8.83(12.71)…11.97(19.74)2(5)10.73(14.46)

注:括号外数值为使用本文方法进行预测的误差结果;括号内数值为使用传统KNN方法进行预测的误差结果。

鄱阳湖位于长江中下游的南岸,地势南高北低,承纳江西境内赣、抚、饶、信、修等五河来水,湖水由北部湖口出口汇入长江,是典型的吞吐型淡水湖泊。鄱阳湖水位变化大,季节性变化明显,枯水期一般出现在春、冬季,丰水期一般出现在夏、秋季节。鄱阳湖水流受长江水位和五河来水的影响,水体流速变化明显,水龄时间短(Qi et al.,2016)。鄱阳湖处平原区,属大风集中区域,特别是鞋山、老爷庙和瓢山风力最为集中(张琍等,2014)。在丰水期,湖面范围大,悬浮物空间变化不仅受河水流速的影响,还受风速的影响(贺志明等,2011;江辉等,2018)。另外,受采砂作业活动等影响,鄱阳湖北部水体呈现高浑浊特征。

根据误差统计结果可知,绝大部分EMAPE均在20%以下,少数在20%以上,这是由于郊区新线站点的5 min进出站客流较小,较小的EMAE变动就会带来较大的EMAPE变化。EMAE均值仅为2人次说明预测误差较小,属于可接受范围。通过与传统KNN方法预测误差的对比可以发现,绝大部分的MAE和MAPE均有所降低。改进方法的进、出站量EMAPE均值分别为9.08%、10.73%,传统方法的进、出站量EMAPE均值分别为14.72%、14.46%,改进算法对于进、出站量的预测精度较传统算法分别增加了38.32%、25.80%。

不同类型站点客流平均预测误差的统计结果见表6,对比传统算法EMAEEMAPE的平均值,改进算法中不同站点类型的预测误差均有所降低且处于较低水平,表明改进算法针对不同类型的站点均有较好的预测精度。

表6 广州地铁2016年12月28日至2017年3月31日期间不同类型新线站点5 min粒度进出站客流平均预测误差

预测指标 进站量 出站量 误差指标EMAE/人次EMAPE/%EMAE/人次EMAPE/%居住2(5)8.45(19.33)3(5)9.85(18.90)办公3(5)07.54(11.16)2(3)6.82(10.22)枢纽1(3)4.25(10.22)4(5)12.32(10.42)综合3(6)09.53(17.14)5(8)12.84(18.47)

注:括号外数值为使用本文方法进行预测的误差结果,括号内数值为使用传统KNN方法进行预测的误差结果。

5 结论

本文基于改进FCM算法和改进KNN算法提出了城轨新线客流成长期进出站量短时预测方法,并以广州地铁为例对方法的有效性进行了评价,得出以下结论:

(1) 结合城轨站点短时进出站客流变化的趋势相似性,基于改进FCM算法对站点类型进行了划分,并提出了新线站点的历史数据库构建方法。对比传统FCM算法,该方法能够有效解决算法陷入局部最优的问题,得出更优的站点分类方案和新线站点历史数据库。

(2) 基于趋势距离对新线站点与既有站点之间的数据匹配机制进行了优化。对比传统匹配机制,该匹配机制能够显著减少近邻匹配过程的计算量,增加算法的总体计算效率,提高实际运营过程管理中新线进出量短时预测的时效性。

(3) 基于多元统计回归对KNN算法进行了改进,提出了城轨新线客流成长期进出站量短时预测方法。改进KNN算法能够量化预测过程中的预测目标与近邻数据二者之间的局部线性关系,消除二者之间的差异性,提高新线进出站量的短时预测精度。

在新课改下,学生破解数学重难点内容直接关系到数学课题教学目标实现以及教学质量提高。在小学数学课堂教学中,教师要注重对学生的问题引导,借助行之有效的课题问题,将数学教学环节环环相扣,不断发展班级各个层次学生思维能力,在破解数学重难点内容过程中夯实数学理论基础。

参考文献:

[1] 赵路敏,王奕,杜世敏.新线开通对线网客流特征的影响[J].都市快轨交通,2011,24(2):46-49.

ZHAO Lumin,WANG Yi,DU Shimin.Impact of Opening a New Line on Passenger Flow Features of Urban Rail Transit Network[J].Urban Rapid Rail Transit,2011,24(2):46-49.

[2] 光志瑞.基于土地利用和可达性的城市轨道交通进出站客流量预测[D].北京:北京交通大学,2013.

[3] 程涛,周峰,郦海通.西安地铁2号线南段运营初期客流预测[J].都市快轨交通,2015,28(5):45-49.

CHENG Tao,ZHOU Feng,LI Haitong.Forecasting Passenger Flow on Southern Extension of Xi’an Metro Line 2 in Preliminary Operation Stage[J].Urban Rail Transit,2015,28(5):45-49.

[4] 蔡昌俊,姚恩建,张永生,等.基于AFC数据的城轨站间客流量分布预测[J].中国铁道科学,2015,36(1):126-132.

CAI Changjun,YAO Enjian,ZHANG Yongsheng,et al.Forecasting of Passenger Flow’s Distribution among Urban Rail Transit Stations Based on AFC Data[J].China Railway Science,2015,36(1):126-132.

[5] 姚恩建,程欣,刘莎莎,等.基于可达性的城轨既有站进出站客流预测[J].铁道学报,2016,38(1):1-7.

YAO Enjian,CHENG Xin,LIU Shasha,et al.Accessibility-based Forecast on Passenger Flow Entering and Departing Existing Urban Railway Stations[J].Journal of the China Railway Society,2016,38(1):1-7.

[6] 李得伟,尹浩东.基于物联网设备检测数据的城市轨道交通车站站台多维度实时客流密集度指数预测方法研究[J].铁道学报,2014,36(3):9-13.

LI Dewei,YIN Haodong.Real-time Forecast of Passenger Crowd Index on Urban Rail Transit Station Platform Based on Test Data of Internet of Things[J].Journal of the China Railway Society,2014,36(3):9-13.

[7] GOOIJER J G D,HYNDMAN R J.25 Years of Time Series Forecasting[J].International Journal of Forecasting,2006,22(3):443-473.

[8] WILLIAMS B M,HOEL L A.Modeling and Forecasting Vehicular Traffic Flow as a Seasonal ARIMA Process:Theoretical Basis and Empirical Results[J].Journal of Transportation Engineering,2003,129(6):664-672.

[9] OKUTANI I,STEPHANEDES Y J.Dynamic Prediction of Traffic Volume through Kalman Filtering Theory[J].Transportation Research Part B:Methodological,1984,18(1):1-11.

[10] 张春辉,宋瑞,孙杨.基于卡尔曼滤波的公交站点短时客流预测[J].交通运输系统工程与信息,2011,11(4):154-159.

ZHANG Chunhui,SONG Rui,SUN Yang.Kalman Filter-based Short-term Passenger Flow Forecasting on Bus Stop[J].Journal of Transportation Systems Engineering and Information Technology,2011,11(4):154-159.

[11] 杨军,侯忠生.基于小波分析的最小二乘支持向量机轨道交通客流预测方法[J].中国铁道科学,2013,34(3):122-127.

YANG Jun,HOU Zhongsheng.A Wavelet Analysis Based LS-SVM Rail Transit Passenger Flow Prediction Method[J].China Railway Science,2013,34(3):122-127.

[12] SUN Y,LENG B,GUAN W.A Novel Wavelet-SVM Short Time Passenger Flow Prediction in Beijing Subway System[J].Neurocomputing,2015,166:109-121.

[13] WEI Y,CHEN M C.Forecasting the Short-term Metro Passenger Flow with Empirical Mode Decomposition and Neural Networks[J].Transportation Research Part C:Emerging Technologies,2012,21:148-162.

[14] 姚恩建,周文华,张永生.城市轨道交通新站开通初期实时进出站客流量预测[J].中国铁道科学,2018,39(2):119-127.

YAO Enjian,ZHOU Wenhua,ZHANG Yongsheng.Real-Time Forecast of Entrance and Exit Passenger Flow for Newly Opened Station of Urban Rail Transit at Initial Stage[J].China Railway Science,2018,39(2):119-127.

[15] 张晚笛,陈峰,王子甲,等.基于多时间粒度的地铁出行规律相似性度量[J].铁道学报,2018,40(4):9-17.

ZHANG Wandi,CHEN Feng,WANG Zijia,et al.Similarity Measurement of Metro Travel Rules Based on Multi-time Granularities[J].Journal of the China Railway Society,2018,40(4):9-17.

[16] 冯晓蒲,张铁峰.四种聚类方法之比较[J].微型机与应用,2010,29(16):1-3.

FENG Xiaopu,ZHANG Tiefeng.Comparison of Four Clustering Methods[J].Microcomputer &Its Applications,2010,29(16):1-3.

[17] 周开乐.模糊C均值聚类及其有效性检验与应用研究[D].合肥:合肥工业大学,2014:1-31.

[18] YANG H,ZHANG K P,LIU H E.Online Regulation of High Speed Train Trajectory Control Based on T-S Fuzzy Bilinear Model[J].IEEE Transactions on Intelligent Transportation Systems,2016,17(6):1496-1508.

[19] LU H P,SUN Z Y,QU W C.Big Data-driven Based Real-time Traffic Flow State Identification and Prediction[J].Discrete Dynamics in Nature and Society,2015,2015:1-11.

[20] 谢海红,戴许昊,齐远.短时交通流预测的改进K近邻算法[J].交通运输工程学报,2014,14(3):87-94.

XIE Haihong,DAI Xuhao,QI Yuan.Improved K-nearest Neighbor Algorithm for Short-term Traffic Flow Forecasting[J].Journal of Traffic and Transportation Engineering,2014,14(3):87-94.

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
MATLAB模糊C均值聚类FCM改进的推荐系统协同过滤算法分析MovieLens电影数据集
算法模型调优指南
你使用过哪些数据分析的方法?
数学建模及其算法概述
《基于历史拥堵图和共识日识别的交通拥堵和出行时间预测》
各种聚类算法的比较
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服