二、数据质量和可访问性一个大型的数据管理和完整性项目的结果是:·明确数据改进的共同优先事项·更健康、更准确的数据库·严格的基准流程,积极监测数据库健康状况,衡量进展,并为执行讨论和董事会报告提供信息·外联数据的完整性提高50%·强大的数据完整性协议,收集、清理、集成和分析数据·分享数据作为组织资产的团队观点,以及数据管理的新方法·增加对现有数据的信心,以支持明智的决策确定哪些数据对组织真正重要对于任何数据质量计划都是至关重要的。组织必须尽早确定优先级字段,并将焦点缩小到那些被认为对关键业务结果最重要的领域。一旦确定并商定了优先领域,就可以围绕这一高优先数据的质量制定行动计划。随之而来的问题是:我们如何处理这些数据?组织不可能保存所有的数据,因此,分析师和数据管理人员必须依靠判断来决定保留哪些数据以及如何存储数据——在处理明确确定的优先级数据字段时,这些决策要简单得多。可以应用以下标准和问题来确定保留哪些数据以及出于什么原因。通常情况下,如果需要遵从法规,或者如果下列任何问题得到肯定的回答,则应该保留数据。根据数据必须满足的长期目标以及与这些目标相比它的价值有多高,标准可能会有不同的权重。1质量水平·描述:是否有足够的信息(例如,来自最新的数据管理计划),关于数据是什么,如何以及为什么收集数据,以及如何处理数据以评估其质量和对确定的目标的有用性?·质量:在完整性、样本量、准确性、有效性、可靠性、代表性或其他相关标准方面,数据质量是否足够?2需求·用户:是否有用户在等待这些数据,或者过去是否有需求的证据(例如,数据是否会为已建立的资源或系列增加价值)?·推荐:资助者或学习/研究领域的专业协会或同等的身体推荐这种类型的共享数据或在这个研究主题?·整合:数据描述的元素是否适合其他研究领域的标准化术语或词汇(例如,地理位置和时间段)?·声誉:研究小组或项目产生的数据是否在原创性、重要性和之前研究成果的严谨性方面得到了高度评价?提供数据是否会显著提高一个团队或项目的声誉?·吸引力:数据是否具有广泛的吸引力(例如,与具有里程碑意义的发现、重大的新研究过程或国际政策和社会关注有关)?3复制·不可复制:复制数据是否困难、昂贵或不可能(例如,在不可重复观察的情况下)?4使用障碍·清楚:数据是否根据其敏感性进行分类,并且不受隐私/伦理、合同、许可或版权条款和条件的限制,这些条款和条件会限制公众访问和重用?这项研究是否有正常的限制域?·开放格式:数据的格式是否不需要许可证费用或专有软件或硬件的重用?·独立性:如果使用数据需要任何专业的软件或硬件,它是否在研究领域中被广泛使用并易于获得?5存储·唯一:这是数据的唯一和最完整的副本吗?·风险:数据是否保存在保证长期存储的位置?三、数据治理研究表明:客户参与策略以及潜在的客户体验改善计划的相关数据需求是大多数接受调查的高级主管的首要任务。在我们与客户的对话中,这些优先级逻辑上的结论:数据不再被视为单个部门的责任。相反,数据必须成为跨越多个群体的责任。如何管理数据导致了围绕数据治理的几个重要决策。根据数据治理研究所(Data Governance Institute, DGI)的定义,数据治理是一个信息相关流程的决策权和责任系统,根据商定的模型执行,这些模型描述了所有数据相关事项的许多规定,包括什么、谁、何时、为什么和如何。数据健康或质量是治理的一个关键方面,该决策系统允许组织维护其数据健康水平,以确保关键战略和计划目标能够实现。