打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
时间序列多粒度趋势检测分析(Multi

 图1 时间序列数据的趋势检测

时间序列数据数据越来越多,如何快速的从这些数据中得到一个概览和展示数据之间的结构显得极为重要。对于典型的时间序列数据集合数据(ensemble)具有复杂性和不确定性的特点。本文对该类数据提出了一种趋势检测的几何模型,提供多种交互手段,能够让我们快速的看到时间序列数据的变化趋势和它们之间的关系。

在这篇文章中,我们主要关注一维时变数据。在时间序列数据中,一个重要的时间序列数据是集合数据(ensemble)。集合数据是由复杂模型模拟出来的数据,它们的区别在于开始条件和参数设置的不同。它们主要被用来做天气,气候和飓风预测。快速的对原始时间序列数据进行分析是不切实际的。主要由于数据高度的复杂性和它们内部的不确定性。我们可以使用统计的方法来可视化不确定性数据和减少它的复杂性。例如:热力图可以表示数据分布的一个整体。但是这同时是这些方法的缺点。这些方法过度强调极值会让我们失去数据的结构。另一种方法,我们可以通过趋势检测得到数据的结构。趋势检测是将一段时间内相似性的实体当做一个趋势。趋势检测不是很富挑战性,但是如何使用可视化让人感知这些趋势分布是比较重要的。在这篇论文中,我们主要的贡献在于:提出了一种一维时变数据趋势检测的几何模型,提出了一 系列趋势检测的可视化标准。

对于趋势检测有一些重要的属性:支撑(support),持续时间(duration)和范围(range)。支撑指的是属于同一个趋势的时间序列的数目。持续时间指的是行为相似的时间序列持续的时间。范围指的是趋势所对应时间序列最大最小值之间的间隔。

为了检测数据的相关性,我们需要定义一些任务。我们的任务主要围绕着趋势分析和趋势之间的连通性。

T1a:  评估趋势的支撑
T1b:评估趋势的范围
T1c:评估趋势的分布
T2a:时间序列之间的的行为
T2b:粒度如何影响趋势的形成
T2c:趋势结构的连通性
T2d:不同趋势之间的相关性

作者使用Buchin et al. [1] 提出趋势检测算法。Buchin et al.解决在轨迹数据中检测最大聚合问题。使用(support,duration,range)作为约束条件。在一个趋势中,时间序列的之间的传递距离不能超过range。构成一个趋势所需的最小时间序列的数目是support。一个趋势的最小持续时间为duration。作者限定该算法必须从时间序列的开始进行计算,提高了算法的时间效率。

图2 改进的趋势检测算法

图3 对support,duration和support三个参数进行解释

在图4中蓝色线在[ts,t1]构成一个聚合。但是该聚合不是最大的,所有蓝色线和绿色线在[ts,t1]构成了一个最大的聚合。在[t2,t3]橘红色和蓝色线没有构成一个聚合,因为它们的持续时间太短。

图4 Buchin et al的最大聚合

我们使用红色中心线表示一个趋势。红色中心线的宽度使用趋势的support进行编码。在图5(b)中我们可以看到提取到的趋势,不同趋势之间会失去连通性,为了让其连通,我们使用插值的方法。T是最大的趋势,S是其分离出的子趋势中的最大的。我们将T和S的中心线进行插值得到了图5(c)中的T'。

图5 趋势的提取和处理。(a)时间序列的热力图;(b)提取出的趋势;(c)连通的趋势

第一个案例,我们使用GapMinder[2]数据,该数据包含大约200个时间序列,表示不同国家工业对GDP的贡献值。我们首先使用初始的参数,在图6(a)中可以看到明显的两个趋势,但是还不是很明显。这个时候我们逐渐增大range的值可以在图6(b)中明显的看到两个趋势。可以从每个趋势所对应的阴影部分看到range设置的还是有点大,我们进一步限定初始条件,可以在图6(c)中更加清晰的看到这两个趋势。这个符合我们已有的知识:工业对GDP贡献率下降的国家属于发达国家,反之则为发展中国家。

图6 时间序列数据案例。(a)使用初始参数提取出的趋势;(b)将range增大得到的趋势;(c)进一步约束初始条件得到的趋势

第二个案例中,我们使用两个核模型WRF-ARW和NMM-B NAM生成集合数据。然后对该数据提取趋势。从图7(a)我们可以看到有一个主要趋势和一个小的趋势。为了突出这个小的趋势。我们在图7(b)(c)中刷了部分的时间线进行重新的计算,这样我们可以在(c)中看到明显的两个趋势。实际上,上面的数据是由WRF-ARW 模型生成的,下面的数据是由NMM-B NAM模型生成的。可以通过我们的方法分离出这两个模型产生的数据。

图7 集合数据案例。(a)使用初始参数提取出的趋势(b)(c)筛选部分时间线重新计算出的趋势(d)多次刷选得到的趋势

总的来说,这篇文章提出了一种检测趋势的几何模型。我们可以通过该方法提取出同源数据(典型为ensemble)中的趋势。该文章从多个角度(高亮,阴影,连通性)分析可视化对人的感知。该方法的局限性在于有些提取出的趋势存在重叠现象,没有给出一个很好的在重叠状况下趋势的概览。对于range这个参数目前只能设置全局的,对于有些情况过小会导致噪声趋势很多,过大会导致丢失很多趋势,所以全局的range并不是合理的。

参考文献:

[1] K. Buchin, M. Buchin, M. van Kreveld, B. Speckmann, and F. Staals. Trajectory Grouping Structure. Journal of Computational Geometry, 6(1):75–98, 2015.

[2] Gapminder (Data provider: World Bank). http://www.gapminder.org/data/, Mar 2016.

0 
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
百度大规模时序数据存储(一)| 监控场景的时序数据
基于时间序列的异常检测算法综述
时间序列模型
科学网
SPSS时间序列ARIMA、指数平滑法数据分析汽车销量数据
时间序列预测法
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服