01
—
数据治理体系
如上图所示,数据治理体系包含 主要三部分:
一、组织与角色
确保数据管理的有效执行,建立常态化的专职的数据管理团队、开展专项的日常的数据管理工作。
1、高层管理团队:包括高级领导和决策者,他们负责制定数据治理战略和政策,为数据治理提供支持和资源,并确保数据治理的重要性得到组织中的广泛认可和支持。 高层管理团队一般由CIO\CDO等高层领导组成,负责数字化转型战略的制定。
2、数据治理委员会:由跨部门的代表组成,包括高级管理人员、业务代表、IT专家等。数据治理委员会负责制定数据治理的策略、规程和决策,并推动数据治理的实施。他们还可以协调不同部门的数据需求和冲突,确保数据治理的一致性和连续性。
3. 数据治理办公室(Data Governance Office):一些大型组织会设立专门的数据治理办公室来负责数据治理的组织、协调和执行。数据治理办公室负责制定数据治理策略和规程,培训和教育数据用户,监测和评估数据治理的执行情况,推进数据治理的持续改进。 这些组织和角色相互配合,共同致力于建立和维护一个健全的数据治理体系,确保数据的质量、安全和有效利用。
4、数据管理团队:由专门的数据管理人员和数据管理员构成例如数据管理专员。他们负责数据的日常管理和操作,确保数据的质量、一致性和可用性。他们还负责维护数据字典、数据目录和数据资产清单等,为数据用户提供准确和及时的数据。
5、 技术团队:包括数据架构师、数据工程师、数据库管理员等专业人员。他们负责设计和建立数据治理的技术基础设施,比如数据仓库、数据集成工具、数据安全系统等。他们还负责监控和维护数据技术平台的稳定性和安全性。
6、业务部门与数据使用者:包括各个业务部门的经理和员工,他们是数据的最终使用者。他们需要遵守数据治理的规定和流程,确保数据的正确使用和保护,以支持业务决策和运营需求。
二、制度与流程
数据治理委员会和数据治理办公室制定数据全生命周期管理工作的标准化、确保数据定义/变更/校验过程、决策流程以及考核标准等。
在数据治理中,常见的制度包括以下方面:
1、 数据治理政策:制定数据治理的政策和指导原则,明确数据治理的目标、原则和责任。这些政策可以规定数据的分类和重要性级别,数据使用、共享和访问的规则,数据安全和隐私保护的要求等。
2、数据治理组织结构:建立数据治理的组织结构,明确各级数据治理角色的职责和权限。这可以包括数据治理委员会,数据治理办公室或数据治理团队等,以确保数据治理的协调和有效推进。
3、数据分类与元数据管理:制定数据分类和元数据管理的制度。这包括对数据进行分类和标准化的规定,使用统一的数据定义和元数据标准来描述数据,以确保数据的一致性和可理解性。
4、 数据安全与隐私保护:确立数据安全和隐私保护的规程和机制。这包括制定数据安全策略,规定数据访问和使用的权限,实施加密和脱敏等数据保护措施,确保数据的机密性和私密性。
5、数据访问与权限管理:规定数据访问和权限管理的制度。这包括确立数据访问的授权流程和权限设置,确保只有合适的人员可以获取和使用数据,以控制数据访问的合规性和安全性。
6、数据治理监测与改进:建立数据治理的监测和改进机制。这包括对数据治理实施情况进行定期审查和评估,对数据治理流程和控制进行持续改进,以确保数据治理的效果和可持续性。
这些数据治理制度的具体内容和细节将根据组织的特定需求和业务环境而有所不同。重要的是确保制度的合规性、一致性和持续可改进性,以使数据治理能够为组织带来真正的价值和效益。
在不同阶段输出对应的制度文档主要包括:
1、规划与准备阶段:
- 确定数据治理的目标和范围。
- 确定数据治理的战略和规划。
- 建立数据治理组织结构和角色。
2、识别与发现阶段:
- 确定组织中的数据资产和数据流程。
- 识别和分析数据质量问题和挑战。
- 收集和整理元数据和数据质量指标。
3、 定义与标准化阶段:
- 制定数据分类和标准化规范。
- 建立数据字典和数据目录。
- 确定数据的定义、命名约定和格式规范。
4、 数据访问与权限管理:
- 定义数据访问和使用权限的规范。
- 设计和实施数据访问控制和身份验证机制。
- 监控和审计数据访问和使用活动。
5、数据质量管理阶段:
- 建立数据质量评估和监测机制。
- 设定数据质量指标和数据质量规则。
- 实施数据清洗、修复和改进措施。
6、 数据安全与隐私保护:
- 建立数据安全策略和数据保护措施。
- 设计和执行数据加密和脱敏机制。
- 制定数据隐私保护政策和合规标准。
7. 数据共享与协作:
- 建立数据共享和协作机制。
基于这些基本规则文档,通过后续的工具平台,将数据治理活动进行执行。
三、技术和平台
这里的技术和平台一般是指数据治理中心平台或者数据中台,提供平台化的数据治理功能,主要包含以下几个基本的模块:数据标准管理、元数据管理、主数据管理、数据质量管理、数据模型管理、数据安全管理。
这些模块的主要作用是将上述的制度,在该平台落地执行,将制度或者规范,在平台上上创建不同的标准和质量规则,通过后台系统监控执行,不停的迭代优化,起到提升数据质量的效果。
在这几个基本模块中,元数据管理、数据标准和数据质量是相互作用才能提升数据质量的,下面详细介绍三个模块的主要作用和相关作用关系。
02
—
数据治理的核心模块和相关作用关系
数据标准是一组规则和指导原则,用于确定和维护数据的一致性、可重复性和可靠性。数据标准是对数据的命名、数据类型、长度、计算口径、归属部门等,定义一套统一的规范,保证各业务系统对数据的统一理解、对数据定义和使用的一致性,按照分类,可以分为,表规范,字段规范; 以确保不同数据集之间的比较和整合能够进行顺利和准确。数据标准属性:即数据的属性,一般包括业务属性、技术属性、安全属性、管理属性等,具体可根据实际需求来定义
如上图所示:数据标准精确到字段级,数据标准对应于字段的业务属性、技术属性、管理属性、安全属性,通过对不同的字段建立不同的数据标准,一条标准在标准管理里面即为一条记录,通过标准的和元数据映射,和质量规则的映射可以完成数据质量的判断。
元数据是关于数据的描述性信息。它提供了对数据的定义、结构、性质、来源和用途的描述。元数据包括数据的属性、字段、关系、格式、单位、有效性和质量等信息,可以帮助用户理解和使用数据。元数据还包括数据集的创建日期、作者、版本号以及数据集的访问权限和使用约束等信息。 元数据可以帮助组织和管理数据资源,促进数据的发现、访问和共享。它也支持数据集成和数据分析,可以为数据的查询、检索和处理提供必要的背景和上下文信息。
元数据可以包含多种类型,其中一些常见的类型包括:
1、技术元数据(Technical Metadata):描述数据的物理属性和技术特征,如数据文件的格式、大小、存储位置、访问权限等。
2、结构元数据(Structural Metadata):描述数据的结构和组织,如数据库中表、列的名称、数据类型、关系和索引等。
3、描述性元数据(Descriptive Metadata):描述数据的内容和意义,包括数据的名称、标题、摘要、关键字、分类和注释等。
4、管理元数据(Administrative Metadata):描述数据的管理和维护方面的信息,如数据集的创建者、创建日期、更新历史、访问权限和使用约束等。
5、业务元数据(Business Metadata):描述数据与特定业务领域的关联,包括数据的业务规则、数据质量要求、数据所有权和数据流程等。
6、上下文元数据(Contextual Metadata):描述数据的上下文信息,如数据的来源、采集方式、使用场景、参考文档和相关链接等。
如上图所示,业务系统的元数据通过元数据管理系统采集上来,形成元数据,而数据标准和的落地映射是通过质量规则将数据标准和元数据建立映射关系,同时质量规则会给出判断标准以及评分标准。
数据质量是指数据的适用性、准确性、完整性、一致性和可靠性,也包括数据的可用性、时效性和可信度等方面。数据质量管理是指组织或企业对数据质量进行监控、评估、改善和维护的过程。数据质量管理主要包含质量任务、质量评估、质量报告、质量监控等四个基本模块。
那么三者是如何进行相互作用提升数据质量?
1、数据标准和元数据
1)数据标准智能映射推荐对于提升了元数据的规范性管理其着辅助的作用。
2)元数据分析对于数据标准的新建提供了支撑,反过来,新建的标准同时对元数据管理起到规范作用。
三大模块相辅相成,既作为其他模块的基础又为其他模块提供支撑,同时也通过其他模块丰富了管理手段,最终达到质量的闭环提升。
联系客服