手机信令数据包含的信息一般包括加密的手机识别码、时间戳、位置区编号、小区编号、事件类型、原因编码、归属地编码等。手机信令数据存在采样率低、分布不均、不稳定、不确定的问题。对手机信令数据进行质量分析以保证区域人流量分析时的数据有效性。根据初步分析,数据存在如下三个问题:当日数据里面存在其他日期的数据;数据存在重复数据;数据存在字段为空的情况。因此对数据的质量分析的处理流程如下图:
图 1 手机信令质量分析过程
利用收集信令数据感知城市人口的前提,是了解移动网络中在城市总的覆盖情况。如下图为某城市的移动网络覆盖情况。对于移动网络的覆盖范围,一般以基站为节点,以基站之间构成的泰森多边形[6]来确定每个基站的覆盖范围。
图 3 移动通信网络覆盖
在确定移动通信网络的覆盖范围后,对于需要监测人口动态流量的区域可以表示为多个泰森多边形合并,为此统计每个泰森多边形内的在某时刻的手机用户数量,就可以识别该区域的动态人口分布,具体感知模型如下图所示:
图 4 人口分布感知模型
对于移动互联网和城市区域进行匹配后,我们的人口分布感知模型中首先分析手机用户在移动通行网络的出行情况,然后结合匹配关系,将移动网络的出行用户数量映射到城市区域中,得到各个城市区域的人口分布情况。在此过程中,我们首先利用用户的出行时段和出行轨迹点(用户手机信令经过的通信网络中的基站序列),分析用户的出行轨迹,统计在关注区域内用户数量的时间分布特性,以及进入、离开、停留在关注区域的人口数量。最后,我们将手机用户数量扩样至城市静态人口统计数据。例如,我们只获得的手机用户数为城市人口数量的n%,则在以上动态感知结果的接触上除以该值,即可得到全量城市人口的动态分布结果。
本文以手机信令数据为研究对象,以城市人口动态分布感知为研究目标,研究了手机信令数据在感知人口数量时的质量分析方法,提出了基于手机信令数据的动态城市人口分布感知模型,将为城市人口流量实时监控提供应用基础。
参考文献
联系客服