打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
使用 QGIS 和开源数据进行地理空间分析

GISer last GISer last 2022-04-21 11:343个

今日分享:使用 QGIS 和开源数据进行地理空间分析

文章来源:https://makersportal.com/blog/2017/10/30/geospatial-analysis-using-qgis-and-open-source-data

地理信息系统 (GIS) 是气候学家、卫生组织、国防机构、房地产公司以及几乎所有依赖基于位置的数据的专业人士使用的强大工具。传统上分析地理数据通常非常繁琐,这就是为什么可视化工具必不可少的原因。根据数据的大小和复杂性,市场上有几种强大的GIS软件,从开源(免费)到付费订阅。

每种软件都有其优点和缺点,因此根据应用程序的不同,一种软件可能比另一种更有效。一些领先的软件是:GE Smallworld、Google Earth Pro、AutoCAD Map 3D 和 Maptitude。QGIS 是 ArcGIS 的开源竞争对手,ArcGIS 可以说是 GIS 市场的行业领导者,因此出于财务和易于应用的原因,这里使用了QGIS。

将介绍四种地理分析尺度:一种在城市层面(纽约市),一种在州层面(华盛顿州),一种在国家层面(美国),一种在世界层面。目标是展示任何规模的地理信息系统的强大功能和广度。

1、形状文件和导入数据

我将使用两种类型的数据进行此分析:shapefile 和逗号分隔值 (csv)。GIS 中使用的原始数据通常以逗号分隔;然而,使用第二种类型,shapefile,因为它包含创建我们在地图中经常看到的形状的地理线或多边形。在本教程中,我将使用来自以下四个来源的数据:

1.本地(纽约)-https://data.cityofnewyork.us/Environment/Natural-Gas-Consumption-by-ZIP-Code-2010/uedp-fegm

2.州(WA) - https://data.wa.gov/Natural-Resources-Environment/Water-Quality-Index-Scores-1994-2013-from-The-WA-S/k5fe-2e4s

3.国家(美国)-https://catalog.data.gov/dataset/age-adjusted-death-rates-for-the-top-10-leading-causes-of-death-united-states-2013

4.全球(世界)-https://data.worldbank.org/indicator/NY.GDP.MKTP.CD?year_high_desc=true

上面的数据集可能需要重新格式化,因此请务必深入研究 .csv 文件并删除多个标题,替换 NaN 值,或根据所需分析的程度将数据分成更小的部分。

应该打开 QGIS 并显示最近的项目部分(见下文):

我们想开始一个新项目,所以我们可以直接跳到左边的菜单栏。单击左侧工具栏上显示“添加矢量图层”的“V”图标。您可以在此处添加为特定位置下载的 shapefile。在我们的例子中,它将是纽约市。 

现在,您应该为该位置添加 shapefile。我使用了纽约市的邮政编码 shapefile,因此我们可以调查该城市每个邮政编码的天然气消耗量。可以在此处找到邮政编码 shapefile 。现在,QGIS 仪表板上应显示以下内容:

现在,我们要从 OpenDataNYC 网站导入包含邮政编码天然气使用情况的实际数据。我们通过单击左侧工具栏上显示“添加分隔文本层”的逗号来执行此操作。单击添加分隔文本层并选择包含数据的 .csv 文件后,应显示以下内容:

这里要记住的重要一点是,我们要选择“无几何(仅属性表)”,以便我们可以通过邮政编码组合数据,而不是按纬度或经度。因此,我们现在有了一张天然气消耗值表和纽约市邮政编码的地图。我们希望将两者结合起来创建一个可以按位置(邮政编码 shapefile)映射的数据(csv 文件)的联合分布。为此,我们必须双击图层面板上的邮政编码 shapefile。这应该给我们以下窗口:

现在,我们选择左侧工具栏上的“加入”,然后单击窗口底部的加号。现在,在出现的窗口中,您必须确保两个邮政编码在每个文件(csv 和 shapefile)中的格式相同。然后,我们选择这两个邮政编码列作为连接的“连接字段”和“目标字段”。从这里开始,您可以选择哪些参数从 .csv 文件传递到 shapefile,但为简单起见,我们暂时不考虑这些参数。 

我们应该有一个带有附加值的 shapefile。要对此进行测试,请转到顶部工具栏并选择带有“i”的箭头,称为“识别特征”,然后选择其中一个邮政编码。您应该在右侧工具栏的功能列表末尾看到一些额外的参数。

此时,shapefile 已将 .csv 文件的值纳入每个邮政编码。现在,可以做的一件事是将数据离散地划分为基于颜色的值。为此,我们要再次双击邮政编码shapefile。这一次,我们要选择“样式”。

从“样式”工具栏中,选择显示“单个符号”的顶部。我们想为此添加一些活力,因此将其更改为“已毕业”。这将使查看数据的动态变得容易。

在“样式”工具栏的“分级”选项中,选择要分析的列。我选择分析GigaJoule Consumption。然后选择分类,然后选择应用,然后确定。这应该会为您提供如下所示的蓝色渐变数据。 

上面的蓝色地图展示了 QGIS 的强大功能。不同的颜色表示数据的多样性:蓝色越深,该邮政编码的天然气消耗量越高。 

以下是上述分析的两种变体。第一个图(橙色)是人均天然气消费量。第二个(蓝色)是单位面积的消耗量。两者都表现出在有趣领域的高度集中,可能与收入有关。这两个图都是使用上述方法和相同的数据得出的。为了达到下面显示的结果,使用了一个稍微复杂的例程。该技术需要在数据中更改或创建新字段,并在QGIS中使用最少的编程。下面使用华盛顿州的下一个数据规模探索该方法。 

2、纬度和经度原始数据、创建新字段和更复杂的分析

打开一个新的QGIS项目并导入华盛顿州 Shapefile(在此处查找)。现在添加带有华盛顿州水质数据的分隔文件(此处的数据)。同样,数据格式略有偏差,因此您需要重新格式化纬度和经度值,以便在导入QGIS时可以识别它们。这可以通过在Excel中打开数据并将纬度/经度向量分成两列来完成。重新格式化数据后,导入.csv,但这次使用 lat/lon列的几何图形,而不是像上面那样选择“无几何图形”选项。这现在将基于纬度/经度坐标分布数据,而不是像以前那样的邮政编码。您最终应该得到类似于如下所示的内容:

目前,我们在华盛顿州的shapefile 上有数据点。在此分析中,我们不会将 shapefile 和 .csv 数据结合起来,因此shapefile只是作为水质数据的可视化基础。然而,我们将改变水质数据以产生更动态的数据表示。首先,我们要双击水质 .csv 数据以查看其图层属性。 

进入数据的图层属性后,再次单击“单个符号”并将其更改为“已毕业”。这一次,我们将研究渐变尺寸,而不是颜色。上面写着“方法”的地方选择尺寸。这将改变子弹的大小,而不是它们的颜色,这很难看到。

您可能还想尝试使用 Classify 区域下方的部分,以获得您想要的图层行为。您可以更改图层行为(.csv 数据的行为)以使圆圈更大,它们重叠时表现出的行为等。以下是我对 2013 年水质数据的解释。

QGIS有一个工具,它还允许您执行数学例程。这对于分析数据和利用可用的有限地理空间数据产生更有意义的结果很有用。再次返回 .csv 数据的图层属性,但这次单击“字段”选项卡。 

从这里,我们要选择“字段计算器”,它应该会弹出以下窗口:

我们现在需要决定新字段将传达什么信息。我选择平均20年的水质数据。然而,这有一个警告——有些数据并不存在20年,所以我们最终得到的分数更少(因为 NULL 值)。现在,有一种解决方法,但是,这不是我想在这个有限的教程中介绍的内容。所以,就目前而言,我们采用我们能得到的数据,并对拥有20年数据的站点进行平均。为此,您从“字段和值”中选择 20 个变量并将它们加在一起,然后除以 20。结果如下所示:

3、美国的连续地图

本 GIS 教程中的第三个条目将使用美国的连续地图(在此处找到 shapefile )。该数据的标题是“十大主要死因的年龄调整死亡率”(在此处找到)。数据跨度从1999年到 2015年,包含每年的所有10个主要原因,但是,我选择仅调查因心脏病导致的死亡。同样,需要更改csv文件以正确格式化数据。在这种情况下,日期需要重新定位为csv文件中的列,而不是行。完成上述两项分析后,连续的美国分析应该没有问题。下面我将 csv 文件和 shapefile 结合起来,然后使用渐变颜色的方法来可视化死亡率。 

下面,我减去了2015年和1999年的死亡率,得出了一个差异图。数据越负面,心脏病相关死亡人数的变化就越大。犹他州似乎是在防治心脏病方面取得的进展最少的州,而路易斯安那州似乎有最大的变化,从1999年到2015年,与心脏病相关的死亡人数下降幅度最大。 

4、结论和评论

地理信息系统在基于位置的数据的调查中至关重要。我调查了四种截然不同的地理空间数据,从天然气消耗量、水质指数,一直到与疾病相关的死亡人数和世界各国的 GDP。GIS 的力量依赖于用户,我希望这个简短的教程能够在使用地理空间分析工具箱中的一个特定工具时赋予一定的能力。 

在数据分析的宏伟计划中,这里显示的分析将严重不足。我演示了简单的数学技巧,但没有过多说明原因。还经常需要进行一定量的数据过滤,这里也没有进行。因此,过于密切地解释这些数据是不明智的,而是将其用作完成您自己对数据模式和趋势的调查的工具,无论是用于天气、疾病映射、空间相关的金融模式等。对健康趋势、GDP 或水质等敏感数据进行分析时,应始终对数据的来源、过滤方式、缺少数据的地方进行分步描述;还应该计算一些统计参数,以确保其他人的结论是正确和合理的。此外,我认为对于任何对 GIS 感兴趣并希望从该领域的开源区域开始的人来说,这是一个很好的起点。

5、本页引用:

Hrisko,J.(2017)。使用QGIS和开源数据进行地理空间分析。创客门户。https://makersportal.com/blog/2017/10/30/geospatial-analysis-using-qgis-and-open-source-data

结束。


  • 不看此公众号

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
1850万条 | 世界地图POI兴趣点数据集
shapefile存储时间字段
可视化地图设计指南:矢量地图的制作获取方法,这也太好用了!
关于php导出支持淘宝助理的CSV数据 新图片字段的问题
excel导入数据库实操
【ArcGIS小技巧视频教程】(1):GIS数据来源下载攻略
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服