地理信息系统基础学习笔记（3）—

互助、共享、学习

继续地理信息系统基础的学习，今天学习第四章空间数据的表达。

上面这本书就是我学习的教材，大家需要一起学习的可以点击购买。

一共八章（第一章绪论、第二章地理信息系统的构成、第三章空间数据的获取、第四章空间数据的表达、第五章空间数据处理、第六章空间数据管理、第七章空间查询与空间分析、第八章空间数据的可视化与地图制图）

第四章空间数据的表达

空间数据的表达主要就是介绍了地理系统与地理现象；空间对象及其定义；空间对象关系；空间对象的矢量表达；空间对象的栅格表达；混合数据结构与一体化数据结构；镶嵌数据结构；四叉树数据结构；超图数据结构。

这一章的内容相对而言比较的抽象，尤其是讲到空间栅格、矢量对应的四叉树数据结构、超图数据结构等的数据结构时，需要大量的几何、代数以及计算机编码编程的思想进行理解。如若仅限于ArcGis操作上的理解，但其实也不必完全搞懂弄通，因为其模块工具已经是现成的了。想的就是知道有这么一个理论、数据结构操作模式。对应的模块工具搜索和使用不会那么的生硬，碰到这样的问题需要提问了也可以有一个明确的方向就已经相当不错了。当然，如有志于对数据结构这块进行学习摸索的小伙伴那么就不建议仅仅进行本章的学习，可以寻找一些有关数据结构的书籍来进行详尽的学习。本书也有对这块的推荐书籍（《空间数据结构研究》）是比较老的一本书，大家也可以看看其他有关的数据结构的书籍。

地理系统与地理现象主要介绍：地理系统、地理现象两部分。

地理系统是一个开放复杂的系统。地理系统是一个开放的复杂巨系统，所谓开放系统，就是说地理系统和其他系统有关联，有交往，既有能量物质的交往，又有信息的交往，而不是封闭的。所谓巨系统，就是它有成千上万个子系统，所谓复杂的巨系统，就是子系统的种类非常多，人是一种子系统，还有种类繁多的植物和动物，山山水水以及地下矿产等等，形成了复杂巨系统的内部层次，其结构多变而难以分清确定（钱学森）。

地理信息系统目前所涉及的范围主要在岩石圈和大气圈之间。归结为两大方面：自然环境系统和社会经济环境系统。

地理信息系统即是人们通过各种地理现象的观察、抽象、综合取舍，得到实体目标，然后对实体目标进行定义、编码结构化和模型化，以数据形式存入计算机内。

对于地理现象的观察，通常分四种几何类型来抽象观察和描述：1、呈点状分布的地理现象；2、呈线状分布的地理现象；3、呈面状分布的地理现象；4、呈体状分布的地理现象。

空间对象及其定义主要介绍：零维空间对象、一维空间对象、二维空间对象、三维空间对象、聚合空间对象的定义。

零维空间对象的定义：表明几何位置的零维对象由两个（x,y）或三个(x,y,z)一组的坐标说明其位置。分别包括：1、实体点（NE）;2、标号点（NL）；3、面点标识（NA）（在某面之内标明该面属性信息的点）；4、节点（NO,NN）（节点是零维对，它是两条或多条连线或链的拓扑连结点，或者是一条连线或链端点。）。

一维空间对象的定义：即直线。直线是一维对象的通类术语。分别包括：1、线段；2、弦列（LS）；3、弧（AC,AE,AR,AN,AU,AB）;4、拓扑连线（是两个节点的拓扑连接，可以其节点的顺序确定其方向）；5、链（是一个非相交线段和（或）弧的无分支而有方向的序列。它的两端以节点维界，这些节点不一定是相异的。）；6、全链（是一条可以显示地定位左右多边形和始终端节点的链。）；7、面链（是一条可以显示地定位左右移动但不能定位终端节点链。）；8、网链（是一条可以显示地定位始终端节点但不能定位左右多边形的链。）；9、环（是一个由不相交的链或弦列和（或）弧的闭合序列，一个环表示一个封闭的边界，但不表示封闭内的面积。G-环，GT-环）。

二维空间对象的定义：面是一个有界连续的二维对象的通类术语，它可以包括也可以不包括其边界。分别包括：1、内面（不包括其边界的面）；2、G-多边形（PG）；3、GT-多边形（PR，PC）；4、广义多边形（PU，PW）；5、虚多边形（PV，PX）;6、像元（是一个二维的图素，它是最小的不可再分的图像元素。）；7、网络单元（表示一个网单元的二维对象）。

三维空间对象的定义：三维空间对象包括：1、体元（是一种表示三维实体的体元素，它是一种方形实体，是三维实体中最小的不可再分割的元素。体元的三维坐标是x，y，z。）；2、标识体元（类似于多边形内的标识点。标识体元用来标识一个三维体空间。是一种最小的不可再细分的体元素。三维坐标是x，x，z——表示体元在体空间的位置。可能是非空间维，如时间维。）；3、三维组合空间目标（可以由二维空间目标组合，也可能由三维体元构成。）；4、体空间（三维空间实体，通常可以划分维体元表示。即为体元的聚集目标。）

聚合空间对象的定义：零维、一维、二维等多个简单对象之间的相互关系以此定义聚合空间对象（如：网格、图像和图）。分别包括：1、图像（GI，GJ，GK，GM）（网格是某种面的规则或接近规则的镶拼）；2、层（是组合的，按面分布的空间数据集合，它表示某一专题的实体实样或在众多空间对象的关系中具有公共的属性或属性值，在栅格数据中，特指与部分或全部网格或图像有关的属性值的多维矩阵。）；3、栅格（栅格系指同一网格或图像的一系列覆盖层。）；4、图形（是拓扑学意义上相互关联的零维（节点），一维（拓扑连线或链），有时包括二维（GT-多边形）对象的集合。本书采用三种类型限制规则：平面图形、网格和二维拓扑面。以上三种类型都遵循这三条规则：1）一个节点可以是一条或多条拓扑连线或链的端点；2）每条拓扑连线或链以一对有序的，但不一定相异的节点为端点；3）拓扑连线和链只能在节点处相交；5、平面图形（它的节点、拓扑连线或链对象出现在平面上，或者可以表示在一个平面上。在平面上的任何给定的点，可能存在不多于一个的节点。拓扑连线或链只可能在节点相交。）；6、二维拓扑面（是指一个平面图形及其相关的二维对象。）；7、网格（是一种没有其他二维对象的图形，它是由节点和拓扑连线组成。）

空间对象关系主要介绍点、线、面三种图形的6种组合关系，即（点与点、线与线、面与面、点与线、点与面、线与面）。

在学习这一节的开头，首先需要明白解析几何与GIS中的拓扑几何在描述空间关系上的不同。解析几何的分析方法主要涉及空间目标的坐标、角度、方向、距离、周长和面积等。在空间关系方面，我们采用拓扑几何来描述，涉及的术语有“相邻”、“相离”、“相交”、“包含”、“重合”等。因此，几何结构相差很大的图形，它们的拓扑结构可能相同。所以，空间对象的关系又称拓扑关系。

空间拓扑关系极为复杂，本书仅对点与点、线与线、面与面、点与线、点与面、线与面的邻接关系、相交关系、相离关系、包含关系和重合关系。

点与点的关系（P-P）:本书讨论的点不仅包括点状地物，也包含结点等几何对象。相离关系，两个点不在同一位置。重合关系，两个点坐标一致，完全重合。点与点不存在邻接、相交和包含关系；实际上它们都归结为重合关系。

线与线的关系（L-L）:邻接关系，两条线相邻接，至少它们有一个公共的结点。相交关系，两条线立体相交或平面相交。相离关系，两条线没有交点和汇合点。包含关系，一条线完全或部分包含了另一条线。重合关系，一条线与另一条线完全重合。

面与面的关系（S-S）:邻接关系，两个面状的地物相邻，它们至少有一段共同的边界。相交关系，一个面与另一个面部分相交。相离关系，两个面之间完全不相交，既没有交点也没有公共边界。包含关系，一个面完全被另一个面包含。重合关系，两个面的边界完全相同，它们重合在一起。

点与线的关系（P-L）：邻接关系，一个点恰好落在一条线的端点。相交关系，点实际上是落在线状目标上。相离关系，点既不在线的端点，也不在线的两端点之间。包含关系，线可以包含点，其概念和点与线相交一致。重合关系，不存在。

点与面的关系（P-S）:邻接关系，一个点正好落在面的边界上。相交关系，一个点状目标（不一定是线的结点）恰好落在面的边界上。相离关系，点远离一个面状地物。包含关系，一个点完全落入一个面内。两种空间关系：1、该点落在哪一个面内；2、这个面包含哪些点。重合关系，不存在。

线与面的关系（L-S）：邻接关系，线是面的全部或者说部分边界。也可能是线端点与面邻接。相交关系，一条线部分或全部穿过一个面。相离关系，面与线相互隔离，既不相交也不邻接。包含关系，一条线完全落入一个面内，它是线与面相交关系的特殊情况。重合关系，不存在。详见图1-1。

图1-1空间对象关系：

（可以点击放大看）

空间对象的矢量表达主要介绍概述、无拓扑关系的矢量模型、拓扑数据模型、属性数据的表达。

概述：空间对象特征报假案了空间特征（空间位置和拓扑关系（也可理解为两物体之间的相对关系。））、属性特征和时间特征。空间对象的计算机表达即是用数据结构和数据模型表达空间对象的空间位置、拓扑关系和属性信息。本书写作年代相对较长，没有讨论时态数据，只对空间位置、拓扑关系和属性信息进行讲解。大家感兴趣可以了解了解时态数据的相关内容。空间对象的计算机表达的主要形式：1、基于矢量的表达；2、基于栅格的表达或是两种混合的表达。矢量形式最适应于空间对象的计算机表达。空间关系表达不仅包括记录信息的结构，而且包括信息操作的机制。

无拓扑关系的矢量模型：也称面条数据模型，仅记录空间目标位置坐标和属性信息，而不记录它的拓扑关系。其有两种形式：1、每个点、线、面目标直接跟随它的空间坐标；2、点坐标作为一个文件，线和多边形由点号组成。

在第一种形式中，每个实体的坐标都独立存储，毫不顾忌相邻的多边形或线状和点状物。点目标：[目标标识，地物编码，（x，y）]；线目标[目标标识，地物编码，（x1，y1），（x2，y2)…………（xn，yn）]；面目标[目标标识，地物编码，(x1，y1)，（x2，y2）……（xn，yn），（x1，y1）]。点位字典（以克服多边形裂隙、坐标数据重复）。

拓扑数据模型：关联拓扑关系通常有两种表达方式：全显示表达和半隐含表达。1、全显示表达，指结点、弧段、面块相互之间的所有关联拓扑关系都用关系表显示地表达出来。全显示表达是指结点、弧段、面块相互之间的所有关联拓扑关系都用关系表显示地表达出来。这种关系是以弧段为桥梁建立的。（具体小伙伴可以看看书中的示例图）。部分显示表达指仅用前面的部分表格表示几何目标间的拓扑关系。结点通常是几条弧段的公共交点，弧段也往往是面块的公共边界。建立了面块-弧段拓扑关系的共享边界的修改就方便得多，而没有建立拓扑关系的公共边的修改，则需要分别对两个多边形的数据进行修改（此处操作过ArcGis修改两个面的小伙伴呢可能就会相对感受深刻，编辑一个面要么超过相邻面的范围造成重叠，要么与相邻面相离造成缝隙，这些情况都是建立的图层面没有创建拓扑关系的原因。）。

属性数据的表达：空间目标的属性特征分为两种：1、类别特征，即它是什么？（用类型编码来表达）2、具体的说明信息，或者说统计信息（用属性数据结构和表格说明）。

空间对象的栅格表达主要介绍栅格数据概念、层的概念、栅格数据的组织方法、矢量与栅格数据结构的详细比较。

栅格数据的概念：栅格数据结构实际就是像元阵列，每个像元由行列号确定它的位置，且具有表示实体属性的类型或值的编码值。点实体在栅格数据结构中表示为一个像元；线实体则表示为在一定方向上连接成串的相邻像元集合；面实体由聚集在一起的相邻像元集合表示。栅格数据的优点：1、在计算机处理中行列像元阵列这种数据结构非常易于存储、维护和显示；2、栅格数据是二维表面，其上的地理数据离散量化值，意味着地表一定面积内（像元地面分辨率范围内）地理数据的近似性。像元计算面积时的方法及取舍对像元所示现实地物大小有影响。

层的概念：栅格数据结构假设地理空间可以用平面笛卡尔空间来描述。每个笛卡尔平面中的像元只能具有一个属性数据，同一像元要表示多种地理属性时则需要多个笛卡尔平面，每个笛卡尔平面表示一种地理属性或同一属性的不同特征，这种平面成为层。

栅格数据的组织方法：从最优数据存取、最少的存储空间、最短处理过程三方面考虑，从层的对应关系有三种组织数据可能的方式：1、以像元为记录的序列；2、以层为基础，每一层又以像元为序记录它的坐标和属性值，一层记录完后再记录第二层；3、与第二种一样，以层为基础，但每一层内以多变形（也称制图单元）为序记录多边形的属性值和充满多边形的各像元的坐标。注：这里的属性值，实际上仅是地物的属性编码，还不是目标的具体说明属性。

矢量与栅格数据结构的详细比较：

1、矢量数据结构：

优点：（1）表示地理数据的精度较高；（2）严密的数据结构，数据量小；（3）用网络连接法能完整地描述拓扑关系；（4）图形输出精确美观；（5）图形数据和属性数据的恢复、更新、综合都能实现；（6）它是面向目标的，不仅能表达属性编码，而且能方便记录每个目标的具体的属性描述信息。缺点：（1）数据结构复杂；（2）矢量多边形的叠置算法较为复杂：（3）数学模拟比较困难；（4）技术复杂，特别是更加复杂的硬、软件。

2、栅格数据结构：

优点：（1）数据结构简单；（2）空间数据的叠置和组合十分容易方便；（3）各类空间分析都很易于进行；（4）数学模拟方便。缺点：（1）图形数据量大；（2）用大像元减少数据量时，精度和信息量受损失；（3）地图输出不精美；（4）难以建立网络连接关系；（5）投影变换花的时间多。

混合数据结构与一体化数据结构主要介绍：矢量栅格混合数据结构、矢量栅格一体化结构。

从构造结构的远景来看，矢量与栅格结构是一逻辑对偶。矢量结构的基本逻辑单位是空间实体；栅格结构的基本逻辑单位是实体的空间的位置，已知物体在哪个位置上的存储是以位置属性显式地存储的。

矢量数据结构的明显优点在于：通过给定唯一的目标标识（或逻辑编号）使每个物体具有良好的可个性化的特性，并能根据名称和各种复合的条件使每一个物体具有良好的可选取性，便于空间查询与空间分析。所以目前大部分GIS软件都采用矢量数据结构。

栅格数据在GIS中亦有重要作用，特别是在GIS与遥感和DEM结合方面，具有不可替代的作用。

矢量栅格混合数据结构：形式结构多样。最简单直接的形式是矢量栅格数据不作任何特殊处理，分别与它们各自的数据结构存储，需要时将它们调入到内存，进行统一的显示、查询和分析。比较高级的功能是栅格层不仅可以是以byte存储的影像，而且可以是任意数值或字符的地物编码，这样可以进行矢量栅格的联合查询与分析。Vector与Raster数据结构的组合，兼有矢量和栅格结构的特点，其基本逻辑单元是条带，当数据按栅格方式组织时，每一个条带在Y方向有固定的宽度，并对应着一组邻接的线划，每个条带包含有栅格成分，也有矢量成分。同样以X、Y坐标为标刻，以条带为索引，连接栅格部分与矢量部分。

矢量栅格一体化结构：同时具有矢量实体的概念，又具有栅格覆盖的思想，即具有栅格矢量两种数据结构的特点。该数据结构的理论基础是多级格网方法、三个基本约定和线性四叉树编码。多级格网方法是将栅格划分成多级格网：粗格网、基本格网和细分格网。粗格网，用于建立空间索引；基本格网的大小与通常栅格划分的原则一致，即是基本栅格的大小。由于基本栅格的分辨率比较低，难以满足精度，通过对有点划线的网格，再进行细分。各网格都采用线性四叉树编码方法，用Morton码表示，M0表示粗格网的地址码，M1表示点线通过基本网格的地址码，M2表示坐标点在细分格网的地址码。

镶嵌数据结构主要介绍：规则镶嵌数据结构、不规则镶嵌数据结构。

镶嵌（tessellations）数据结构包括规则镶嵌数据结构和不规则镶嵌数据结构，它们特别适应于三维离散点状空间数据的表达。规则镶嵌最典型的应用模型是格网数字高程模型，不规则镶嵌最典型的数据结构是泰森（Thissen）多边形或者称Voronoi图和狄洛尼（Delaunay）不规则三角网。

规则的镶嵌数据结构：所谓镶嵌数据结构即用规则的小面块集合来逼近自然界不规则的地理单元。网格单元必须具有简单的形状和平移不变性，因此仅有正方形和正六边形符合要求，由于正六边形的邻域多于正方形的邻域且其还不能被分割、层次性差，所以正方形面元（像元）是分二维空间的实用形式。网格系统是基于位置的数据模型这一适用于多元、多层次的数据管理系统。其不受其他因素变动的影响，便于进行不同时期地区间的比较研究，反映和预测地理现象的变动规律。网格系统的数据结构变现为通常的二维矩阵结构，每个网格单元表示二维空间中的一个位置，不管是沿水平方向还是垂直方向均能方便地遍历这种结构。

网格系统可以看作是栅格系统的一种特殊形式，区别在于：网格系统中，数据结构逻辑记录是一个网格上的有关信息集合，因此每个网格单元可以独立存取，而在栅格系统中存取的单位只能是一个扫描行（记录）。栅格数据库一般呈矩阵状，而网格数据库可呈不规则状。

不规则镶嵌数据结构：是指用来进行镶嵌的小面块具有不规则的形状或边界。最典型的不规则镶嵌是Voronoi图Delaunay三角网。Voronoi多边形是一种重要的混合结构：融图论与几何问题求解为一体，是矢/栅空间模型的共同观察途径,是不规则的最基本的和最重要的几何构造。最大空圆（largest empty circle ）、欧氏距离。不规则网格的密度可进行调整，以反映空间每一个区域中数据事件的密度，数据越稀，则单元越大；数据越密，则单元越小。将Voronoi多边形中参考点连接起来，即形成了Delaunay三角网。它在地理信息系统或者说数字高程模型TIN模块中广泛使用。Delaunay三角网可以由Voronoi图中构造，也可以根据离散点直接构造。（第五章将详细讨论它的构造算法）

四叉树数据结构主要介绍：线性四叉树、二维行程编码、几种典型的四叉树数据结构、八叉树数据结构。四叉树分割的基本思想是首先把一幅图像或一幅栅格地图（2k✖2k，k＞1）等分成四部分，逐块检查其格网值。如果某个子区的所有格网都含有相同的值，则这个子区就不再往下分割；否则，把这个区域再分割成四个子区域，这样递归地分割，直到每个子块都只含有相同的灰度或属性值为止。如图1-2为一个二值图像的区域和编码。

图1-2：

（点击可放大）

如上图的分割方法被称为“top-down”的从上而下的分割方法，先检查全区域，内容不完全相同再四分割，往下逐次递归。还有一种称之为“bottom-up”从下而上的方法建立。常规四叉树方法除了记录结点外，还要记录中间结点。结点的命名可以不按严格的规则，结点之间的联系主要靠指针表达。每个结点需要六个量表达：父结点指针（前趋），四个子结点指针（后继）和本结点的灰度或属性值。应用于数据索引、图幅索引等。

线性四叉树：只存储最后叶结点信息，包括叶结点的位置、大小和网格值。线性四叉树结点的编号需要遵照一定的规则，这种编号称为地址码，隐含了结点的位置信息。常用四进制或十进制的Morton码表示地址码。

（1、基于四进制的Morton码及四叉树的建立

基于四进制的Morton码的生成和四叉树的建立过程有两种不同的方案：1、用自上而下分裂的方式再建立四叉树的过程中逐步产生Morton码；2、先计算每个格网的Morton码，然后按一定的扫描方式采用自上而下的合并方法建立四叉树。如图1-3，为自上而下分解四叉树的过程编码。

图1-3：

（点击可放大）

具体的原理计算过程，各位小伙可以详细看书。用一句话概括就是：先把划分区域分为四份，标号0、1、2、3分别表示左上、右上、左下、右下，每个四分出现的格网相应递增一位数且每位数以0开始3结束，即Morton码的每一位数字都是不大于3的四进制数，如上图1-3所示各位参照学习。这种方法需要大量运算，因为大量网格需要重复检测，重复检测的次数等于该叶结点Morton码的位数。

如上两图（图1-2和图1-3）的编码规则，ArcGisdada建议各位小伙伴可以尝试自行画画，可以更容易弄懂，也可以加强对其编码规则的理解。

建立线性四叉树的另一种方式是采用自下而上的合并方法，先将二维矩阵元素的下标转换成Morton地址码，并将元素按码的升序排列成线性表。

第一步将十进制的行列号转换成二进制数表示，转换的数学公式为

式中MOD为取余函数，INT为取整函数，Ⅱ为十进制号，Ⅰb为二进制号，k为中间循环变量。

缺点：1、码的内外存开销大，由于大多数语言不支持四进制变量，需要用十进制长整型表示Morton码；2、运算效率不高。

（2、基于十进制的Morton码及四叉树的建立

这种十进制的Morton码是0到M的自然数，合并过程的扫描方式可直接按这种自然数码的顺序进行。具体的运算过程同理需要各位小伙伴自己翻阅书本认真学习了。

二维行程编码：若后一格网的网格值不等于前一格网的值，记录后一格网的地址码和相应的格网值，即将格网值相同的前后结点合并成一个值，这种记录方法非常类似于传统的一维行程编码，称之为二维行程编码。其利用线性四叉树的地址码，但没有结构规则的四叉树，甚至已失去了四叉树概念。因此其修改、删除、插入等操作可节省更多空间且操作简单。

几种典型的四叉树数据结构：1、QUILT系统，是美国Shaffer，Samet和Nelson等推出的一个基于线性四叉树的地理信息系统。2、Mark等人的二维行程码方案。3、杨红光的边界四叉树方案。4、Molenaar与Fritsch的混合数据结构方案。

八叉树数据结构：是由四叉树进行扩展应用到矿体等真三维现象的一种三维空间数据结构。体元（voxel）

超图数据结构主要介绍：超图数据的概念、超图数据结构的基本概念、超图数据结构的基本单元、基本地理物体表示。是由法国巴黎大学Francois Bouille教授20世纪80年代初向欧洲航天研究发展局提交的超图数据结构报告中提出的新的数据结构理论。

超图概念是图的一个概念扩展，在图G=（V,X）中，X的每一个元素可以看作是V的一个二元子集，在超图中，我们考虑任意的子集。

超图数据结构的基本概念，是进一步对复合制图物体进行表示，如与它们有关的空间的和非空间的属性与联系的一种机制。（超关系模型，通过使用类别、物体、属性和关系这四种抽象数据类型，为表示基本地理实体、复合地理实体以及它们的空间与非空间属性提供了有效手段。）

超图数据结构的基本单元，类别、类别的属性（类别的性质）、类别的元素、物体的属性、类别间的层次联系、物体间的层次联系。

以上文章笔记相对较长，看起来如老奶的裹脚布一般无二。确实，学习理论知识总是希望能够快速转变为操作技能，这是无可厚非的也是每个人都有的希望。这里ArcGisdada说说自己的感受吧，理论的学习并不一定能让你记住什么或是会进行某个厉害的操作，但它的好在于总是在你运用操作软件或进行实践活动、工作时会受到它潜移默化的影响，以至于达到理论与实践的双结合。

▼

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。