打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
基于LBSN数据的全国人口分布与流动研究(城市群篇)│前沿

合作研究者:

刘浏、安頔(中规院上海分院)

高瀚、沈健(腾讯云)





合作背景

2016年上半年,由中国城市规划设计研究院与腾讯云联合开展了一项基于LBSN数据的全国人口分布与流动的重要研究工作。该研究专项由腾讯云独家提供的基于地理位置的社交网络数据(LBSN-Location Based Social Network)作为支撑,由中国城市规划设计研究院完成技术研究。本文整理自2016年9月于沈阳召开的中国城市规划年会。




1 数据支持与技术路线

本研究所基于的腾讯大数据达到了同时期所有全国尺度的空间研究层面的最高峰——6亿的月活跃用户规模。采样规模之大,时空跨度覆盖之广,尚属首例。



基于腾讯云团队的数据基础与技术力量,他们开展过一些列的研究工作,比如逃离北上广、春节去哪儿、十一国庆旅游分析、以及城市拥挤预警等。关于腾讯LBSN的相关研究,请关注其公众号“宜出行”,或者也可以点击“微信-钱包-城市服务-城市热力图”观察自己所属区域的热力图。



具体针对双方合作的需求匹配,也为研究工作真正顺利开展,本次合作也采取了史无前例的定制化合作方案。本次研究基于三种不同的研究数据类型:其一为,全国10平方公里的单元网格人口分布;其二为,全国2242个县级单元的人口流动矩阵;其三为,同样县级单元间的消息流加总数据。时间跨度上,为保证研究的严谨并体现时段的多样性,选取了5天的工作日、周末、国庆、以及春节的4个不同时段。(为便于阐述,下文以“人口”指代研究对象)。


此外,本研究数据操作全程封闭,且为大范围地区加总数据,完全脱敏。



2 空间基本分布

以县级单元的划分方式来校核,腾讯活跃用户数与六普的全国13.3亿人口的用户数呈现出高度相关性,相关系数竟高达0.91。



进一步分析,腾讯的用户分布规模体系呈现更加极化的特征。我们将不同规模城市中的人口分布区别开来的时候,可以发现在六普常住人口达到100万甚至到1000万级别的大城市中,腾讯用户的数量相对统计人口更为集中。而在六普常驻人口规模小于50万的单元地区中,腾讯用户的数量也较高。考虑到对比的方便性,我们将图中的坐标近似地以1:2的方式加以呈现。



除了对比人口普查的数据,也可以采用当时更新的2014年全国省级常驻人口统计数据,并以省级为单位进行比对。可以发现在多数的省份中,两者的比例关系依然维持接近于1:2的关系。



但如果将这一情况投射至空间位置上,则会有意思地发现腾讯用户数占比偏高的省市形成了一个“环状”的格局。尽管大数据研究本身不自证,但对于余下的占比偏低的省市,提供一个可能的解释:如以胡焕庸线为划分,我们将中西部欠发达地区的用户占比数较低归结为人口稀少用户采样量不足的话,那么在东北、华中两个画圈的地区则可能更为真实地反映出人口流失的情况。换言之,这两个地区可能有较多的注册人口,但他们中的很大一部分已经流失出去,而在基于位置点计算判定的规则下,他们并不真正“常住”于此。



3 关于城市群

城市群的界定多种多样,学界的判定也五花八门,本文不在这里作过多的分析解释与赘述。(但至少有一点可以确认的是,度娘的解释经常有错误,可忽略不计。)

城市群的界定涉及到方方面面的内容,同时也需要综合考虑大量的因素,本研究仅就针对纯粹基于人口流动这一因素,探讨基于“流”来划分边界的可行性。


最近半年圈子里突然出现了不少星云类型的图,也不知为何突然流行了起来,所幸如此也省去了不少背景介绍,下面这张图或许就是我们目前给出的解答。它取样自工作日时段所有2000多个县级单元间人口流动规模大于1万人次的联系网,由Gephi绘制所得。而所采用的不同颜色所加以区分则是通过社团发现模型(Community Detection)计算而来(modularity=1.0)。


张类似“星云”的地图完全忽略各单元自身的地理位置,当地区单元之间的人口流动联系较强的时候,其单元会基于重力模型而靠的更近。(gephi有多种不同的layout,这里只是其中一种)为避免歧义,这里采用“城市社团”而非城市群的定义来解释研究对象更为合适。不难发现,所谓“夜空中最耀眼的星团”大多被不少印象中著名的城市群或地区所占据,如京津冀、长三角、珠三角、成渝等等,次一级的星团则由各省的省会级城市所领衔,如太原、西安、长沙等地。

进一步放大,可以看到城市群内部的4类不同的“城市社团”:


A “单核集聚型城市社团”


这类社团均以省会城市为“引力核心”,自始至终强有力地吸引着本省周边城市或地区。


B “多核集聚型城市社团”


此类社团的中心核心性同样非常强,但区别于第一种类型的地方在于社团内存在多个不同的“引力核心”。比如成、渝地区,尽管在空间地理上,成都与重庆有260多公里的距离,但以人口流动联系观察,两者已然“亲密无间”。


C “复合网络型城市社团”


在多核网络的基础之上,如果发育出更大量的核心,则会形成网络状的布局。这一格局在珠三角与长三角地区尤为明显。复合的网络化连接使得社团内城市与城市之间打破了空间隔离与行政级别的差异,不同级别或职能侧重的城市都可能会以不同的形式跃出纸面。


D “特殊类型”


“山东半岛城市社团”,与多核集聚型具有一定的相似性,结构上呈现出多核的情况,但又不够“集聚”。这一情况或与其所处的位置上存在不少地理隔绝(山区)有关。


除了这些耀眼的“星云”,在整个图谱中还存在为数众多的“孤星”。他们独立于整个“星系”之外,但保有一定的自组织系统:譬如在黄山市、景德镇市、吉安、阿克苏等城市。这些地区大多依托各自的自然禀赋与特色,自成体系。



如将上述这些星云的分布重新投射回空间位置上,我们看到的全然是另一种格局。若按个数统计,我们将获得17个“城市社团”,整体上这些社团大致以空间团簇的形式出现,但区别于以往其他相关的城市群的划分,多数的“城市社团”存在“断裂”与“飞地”的情况,这当然与我们在计算时刻意没有加入空间相邻的约束条件有关,也从客观上体现出城市或地区之间的发展不平衡,至少从人口流动强弱上而言。


稍作停留,比如在“长三角城市社团”,除了常规分析中的苏南、浙北等地之外,江苏北部的徐州、连云港等地与其也产生了紧密联系,这体现了一定程度上苏南与苏北的联系强化,而苏中地区则出现一定的断档。此外,同样在长三角地区,安徽被判定为另一个以合肥为中心的“社团”,可见现有的情况下基于已有的人口联系数据,安徽尚未紧密联系于长三角发达地区。


很多的“社团”边界与省界吻合,符合我国的行政管理体系,但也有部分的例外,比如“珠三角城市社团”对于广东省周边的江西、湖南、广西等地扩张。更有甚者,远居黑龙江的哈尔滨等地跨过了“辽沈城市社团”,直接与京津冀产生了联系。


除了利用工作日时段的数据进行划分之外,当然也可以采用其他时段进行同样的计算,比如下面的这张就是以国庆时段为例进行的划分。作为特殊时段,这一分布也体现了一定的特殊性,有兴趣的读者可自行分析。



除了采用社团发现模型(Community Detection),流的联系方法还有很多。这里再举一例——K-Core。大体上该方法接近于判别城市的首位度,一个城市或地区被联系越多,那么他的K-Core值往往越高,城市所在层级的地位也越高。关于这一算法不作过多说明,wiki上有大量详细解释。(关于这一部分的内容,感谢远在UNC的陈炎博士提供的宝贵建议。)



依据这一算法,我们将联系大于5000人次的关系予以保留,经过计算依据不同的K-Core值大体上划分为5个档次。



换一个视角,K-Core值处于第一集团的城市大多与我们认识的一线、二线城市相吻合。这些城市分别在其所在地区处于为数众多的关系网中。



而在第二层级的情况却有一定的不同。多数的第二层级的城市分为两类,一类是省会节点城市,如长沙、贵阳、和昆明;另一类是围绕在更高等级的城市周边的城市,比如珠三角的珠海、中山等地,以及长三角的常州、无锡等地。

但有趣的是,并非在所有的高等级城市周边均有很多第二层级的城市,比如北京、郑州、西安、成都与重庆。这一情况可以解释为在这些第一层级的城市周边的地区之间的联系太过稀少,他们的联系网络过分依赖于中心城市,在将中心城市托举起来之后,自身的网络节点作用并没有体现。



以上是本研究的第一部分,介绍了一些开篇背景以及城市群的相关内容。下篇将会介绍其他方面的部分成果,敬请期待。


详细内容必将以研究论文形式呈现,但因涉及多方版权,需详细沟通与协调,目前尚未成形,谢谢分享。





点击浏览相关主题文章

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
全国34个都市圈总人口超8亿,长三角、珠三角连绵区最成熟
长三角/一体化
基于LBSN数据的全国人口分布与流动研究(流动分析篇)│前沿
为什么说中国的未来是大城市群
安徽:净增人口152.7万,6市增长10市下降,合肥的增幅全省第一
前所未有!美国NASA赞叹:上海30年变化堪称天翻地覆!
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服