美国国家数字制图数据标准协会(NCDCDS)将完整性定义为“一种反映数据集中对象与包含所有对象的抽象空间之间的关系的属性描述”。由于NCDCDS提出的完整性定义中,“包含所有对象的抽象空间”含义不明确,1995年出版的Elements of Spatial Data Quality一书对完整性的定义进行了进一步的扩展:完整性描述了数据集中的实体对象是否描述了抽象空间中的所有实体实例,而完整性大小则代表了数据集中的实体对象对抽象空间中所有实体实例的描述程度。
完整性可以通过数据冗余与缺失两方面进行评价。其中,数据冗余是指数据集中存在的某些数据在数据模型或真实世界中不存在或者重复出现;数据缺失是指数据模型或真实世界中存在某些数据但在数据集中发生了缺失。数据完整性描述可以使用的指标有:多余的项、多余项的数量、多余项的比例、重复的项、重复项的数量、重复项的比例、缺失的项、缺失项的数量和缺失项的比例。
联系客服