CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
基于面向对象视角的数据管理框架研究
作者:孙学忠 胡伟 商志坚 熊涛
孙学忠 胡伟 商志坚 熊涛
摘 要 本文基于面向对象方法开展数据管理框架研究,用于处理数据管理框架设计相关的数据管理内容的封装、复用和框架扩展。本文首先论述了数据管理框架设计的必要性,并对业界主流数据管理框架和面向对象方法进行介绍和分析。其次,采用面向对象方法开展框架设计,对数据管理内容进行抽象封装,利用多态和继承技术实现数据管理对象的复用和扩展。最后,完成参考框架设计。该框架分为4个域、11个管理类,具有一定的通用性,可为数据管理工作提供参考。
关键词 面向对象方法;封装;多态;继承;数据管理框架
Research on Data Management Framework from an Object-Oriented Perspective
SUN Xue-Zhong 1 HU Wei 1 SHANG Zhi-Jian 1 XIONG Tao 1
Abstract This paper investigates the design of a data management framework using object-oriented methods, focusing on encapsulation, reuse, and extensibility of data management content. The necessity of designing a data management framework is first discussed, followed by an introduction and analysis of mainstream data management frameworks and object-oriented approaches. The framework is then designed using object-oriented techniques, abstracting and encapsulating data management content, and leveraging polymorphism and inheritance to achieve reuse and extension of data management objects. The resulting reference framework consists of four domains and eleven management classes, demonstrating general applicability and providing a reference for data management tasks.
Keywords object-oriented methodology; encapsulation; polymorphism; inheritance; data management framework
数据价值的发挥需要通过有效的数据管理来实现。数据管理是组织为了交付、控制、保护和提升数据价值,在数据整个生命周期中制订计划、制度、规程和实践活动,并执行和监督的过程[1]。开展数据管理工作通常需要特定的数据管理框架来指导或作为参照。近年来随着大数据应用的深入开展,大数据治理相关的框架设计研究较多[2-5],但目前数据管理框架设计相关的研究还缺乏可参考的研究成果。数据管理框架设计的要点是确定框架内数据管理活动的构成和联系,合理的框架设计可以帮助用户更好理解和优化框架,有助于提升数据管理活动成效。因此,开展数据管理框架设计研究具有一定的积极意义。
面向对象方法是软件工程的重要设计方法,其主要思路是对客体进行合理的抽象和封装,并通过对象的多态和继承,实现软件模块的复用和扩展。数据管理活动通常需要专业数据管理软件工具的支撑,从软件工具设计的视角来看,数据管理活动在软件内部通常是以对象的形式出现,因此利用面向对象方法研究数据管理框架是可行的。本文首先介绍数据管理框架和面向对象方法,其次利用面向对象方法,基于面向对象封装、继承等概念,开展数据管理内容的分析设计,最后给出一个较为通用的数据管理框架。
1 数据管理框架及面向对象方法
1.1 数据管理框架简介
业界经过长期实践形成了一些比较有代表性的数据管理框架,包括国际数据管理协会框架(Data Management Association,DAMA)、数据管理能力成熟度评估模型(Data Management Capability Maturity Model,DCMM)、《数据资产管理实践白皮书(4.0版)》[6]等。
(1)DAMA框架[1]将数据管理分为11个活动域,包括:数据治理、数据架构、数据建模和设计、数据存储和操作、数据安全、数据集成和互操作、文件和内容管理、参考数据和主数据、数据仓库和商务智能、元数据管理、数据质量管理。其中,数据治理是核心,数据治理活动贯穿在其他10个活动域中。每一个活动域都包括驱动因素、目标、原则、活动、工具、方法及实施指南共7个要素。
(2)DCMM[6-7]定义了8个数据能力域:数据战略、数据治理、数据架构、数据标准、数据质量、数据安全、数据应用、数据生存周期,共涉及29个能力项。成熟度分为初始级、受管理级、稳定级、量化管理级和优化级。对于每一个活动域,从组织、制度、流程、技术四个维度进行评估。
(3)《数据资产管理实践白皮书(4.0版)》[7]基于DAMA框架,偏重行业实践案例研究,从资产管理的视角形成特定的数据管理框架。白皮书包括数据模型管理、数据标准管理、元数据管理、主数据管理、数据质量管理、数据安全管理、数据开发管理、数据资产流通、数据资产评估、数据资产运营等10个管理职能,战略规划、组织架构、制度体系、工具和平台、长效机制等5个保障措施,并提供了管理实践。以上3个框架的比较见表1。
上述框架描述的都是数据管理框架的最终形态,属于“是什么”的范畴,对于如何产生这些最终形态,框架中并没有明确的论述。
1.2 面向对象方法
面向对象方法(Object-Oriented)最早出现在软件设计领域。1983年,Abbott R J[10]在软件程序设计语言领域提出了面向对象方法。该方法的主要思路是“建模-抽象-实现”,即对现实世界的客体进行抽象,运用“对象”来对其建模和描述,将其映射到目标空间,比如数字空间,再通过目标空间的特定技术来实现,以完成特定的业务场景。对象是场景相关的,具有封装、多态、继承等特性。面向对象方法能够有效抽象和模拟现实世界的对象,已成为软件系统设计和实现的核心思想和基础,在系统工程、复杂系统、管理等领域得到了广泛的借鉴和应用[11]。
1.3 面向对象方法与数据管理框架
数据管理框架与数据管理实践活动的关系和面向对象方法中的“类-对象”的关系具有相似性,其映射关系如图1所示。
域是从管理者视角对数据管理内容的划分,它可以根据组织的数据战略和自身业务需求进行动态调整。数据管理内容相当于现实世界的客观对象,数据管理框架相当于类视图,数据管理框架包括不同的管理内容,如元数据管理、主数据管理、质量管理等。每个管理内容具有自己的内在功能和操作流程(对应“类”属性和方法),具备封装性和复用性。用面向对象方法来映射、设计数据管理框架,从方法上是可行的。
2 面向对象视角的数据管理框架设计
2.1 问题描述
构建数据管理框架是大多数组织或单位构建数据管理体系、开展数据管理实践的基础。设计数据管理框架,通常需要对以下3个方面进行考量。
(1)方法论选择。由于所属行业和个体存在差异,通常各个单位的数据管理的关注点也存在不同。选择复制已有成熟的数据管理框架,还是采用某种方法来设计适合自身实际的数据管理框架,关系到单位后续框架落地和完善的实施路线、资源投入及实施周期等,是必须要仔细考量的因素。
(2)框架的要素构成和关系。框架的要素构成决定了单位要开展的数据管理活动类型,要素关系确定了活动开展的次序。数据管理内容归属于哪个领域,涉及到单位的部门职责划分和职能扩展。这些具体考量都需要一个系统的方法来统筹解决。
(3)框架的扩展和完善。框架通常情况下是稳定的,当数据管理需求因单位的内外部环境变化而需要调整时,理想情况下,框架应该能够通过自身的扩展和完善机制来应对变化,在确保已有工作延续的同时,满足新的管理需求和避免相关工作的剧烈波动。
2.2 基于面向对象的数据管理框架设计
数据管理框架设计的主要工作是结合单位的实际情况,选择设计方法和原则,确定数据管理内容及关联关系,解决框架的扩展和演进。结合前文分析,笔者认为,数据管理框架和软件系统具有一定相似性,利用面向对象方法的核心特性封装、多态和继承,可以解决数据管理框架设计过程中关于类的抽象与封装、复用及框架扩展等问题。
2.2.1 面向对象视角的数据管理内容抽象与封装
数据管理内容是单位内部开展数据管理活动的集合。管理活动包括要管理的内容和施加其上的管理动作。在面向对象视角下,通过将管理活动封装为“对象”,可以界定管理活动的内容、边界和隐私,设计如何对其进行管理,这对于后续的管理活动落地具有一定的指导意义。下文以主数据管理为例说明抽象及封装过程。
主数据管理是数据管理活动的重要组成部分,其管理对象也是数据,有其自身的结构,考虑到单位对于主数据的管理要求,其属性除了数据本身的属性,还应包括管理需求,如权限、生存周期、持有者、维护者、遵循的数据标准等,并且根据属性的业务需求,设定其访问属性。主数据管理活动通常包括采集、注册、维护、授权等,这些操作可以抽象为主数据管理类的方法。明确了属性和方法,再结合管理需求确定隐私访问策略,即可完成数据管理类的封装。
2.2.2 面向对象视角的数据管理活动的复用
面向对象方法中的多态概念可用来实现设计和代码复用。在数据管理框架设计中,利用多态的设计思路,可以为框架设计过程中管理活动的复用提供解决之道。下面以元数据管理为例予以说明。
元数据包括业务元数据、技术元数据和管理元数据,因管理内容不同,它们各自的属性存在较大差异性,但是管理操作基本相同。采用多态的设计思路,首先可以设计一个元数据管理基类,主要是定义元数据管理的具体操作接口,属性只定义少量公共属性。其次设计业务元数据、技术元数据和管理元数据3个子类,子类定义各自特有的属性,然后针对具体内容,定义各自的操作规程。在单位的实际数据管理工作中,业务元数据和技术元数据的管理很可能是不同的部门或团队来负责,采用多态思想设计的管理活动,可以一定程度上实现人员、规范和流程的复用,对提升数据管理工作成效具有一定参考价值。
2.2.3 面向对象视角的框架扩展
当单位的业务需求或内外部环境发生变化时,框架需要适应变化与时俱进。面向对象方法的继承性可以用来处理框架扩展和完善。下文以数据资产管理为例,说明用面向对象方法处理框架扩展的思路。
数据资产管理和数据资源管理具有一定的关联性,其管理的对象都是物理的数据。利用面向对象方法,可以先定义一个数据资源管理类,确定其属性和对应的方法(即以资源管理视角对数据施加的各类管理操作)。随着数据管理实践的持续推进,单位对数据价值的认识程度将不断深化。在此过程中,可以利用面向对象中继承的概念,在原数据资源类的基础上,增加数据资产管理特定的属性,并补充针对数据资产特有的管理操作。此举能够在保持整个框架中类的结构及其相互关系的稳定性的前提下,实现框架的扩展和演进,满足单位对于数据资源及数据资产的多元化管理需求。
2.3 数据管理框架设计
结合本单位对于数据管理工作的需求,笔者基于主流框架内容组成及各自特点,利用面向对象方法进行分析,尝试开展数据管理框架设计,主要的设计考量说明如下。
(1)按照面向对象分析方法,按照数据处理流程将数据管理活动划分为11个大类:数据战略、数据治理、数据资源管理、数据安全、数据架构、元数据、主数据、数据建模管理、数据集成管理、数据应用和数据质量,基本上涵盖了目前主流框架的所有管理内容。考虑到数据生命周期和数据标准可以看成是数据的固有属性,故不作为单独类存在。
(2)数据战略、数据治理、数据安全与其他8个数据管理内容密切相关,是对其他管理活动的指导和管控;元数据管理、主数据管理等都是对数据管理需求的具体执行活动,故归为实施域。按照这个思路,将整个数据管理工作划分为数据战略域、数据治理域、实施域和数据安全域。
(3)后续新的数据管理要求和内容,可以基于现有的管理内容做类的继承,扩展其属性和方法,实现框架的动态平滑扩展。
最终设计的较为通用的数据管理框架如图2所示。
3 结语
良好的数据管理架构设计可以为高效开展数据管理工作提供指导。本文基于面向对象视角,利用封装、多态和继承等方法开展数据管理框架设计研究,形成了一个较为通用的数据管理框架,可以为本单位及相关单位开展数据管理工作提供一个参考。数据管理工作本身是一个系统性的实践工作,其内容、方法等会随着内外部环境的变化进行动态调整。因此,数据管理框架设计也需要及时调整,以保持框架的稳定和持续演进。
参考文献
[1] DAMA中国分会翻译组. DAMA数据管理知识体系指南(原书第2版)[M]. 北京: 机械工业出版社, 2020: 1-2.
[2]刘桂锋, 钱锦琳, 卢章平. 国内外数据治理研究进展:内涵、要素、模型与框架[J]. 图书情报工作, 2017, 61(21): 137-144.
[3]包冬梅, 范颖捷, 李鸣. 高校图书馆数据治理及其框架[J]. 图书情报工作, 2015, 59(18): 134-141.
[4]孙学忠, 胡伟. 跨境贸易大数据平台数据治理及框架研究[J]. 中国口岸科学技术, 2020, (10): 69-75.
[5]陈鹏. 高校数字资产管理框架的构建与优化研究[J]. 内蒙古科技与经济, 2024, (23): 38-43.
[6]祝守军, 蔡春久. 数据治理工业企业数字化转型之道[M]. 北京: 电子工业出版社, 2023: 28-30.
[7] GB/T 36073—2018数据管理能力成熟度评估模型 [S]. 北京: 中国标准出版社, 2018.
[8]马达, 严玲玉. 基于DCMM的政府数据治理路径探究[J]. 网络安全和信息化, 2023, (8): 46-48.
[9]田佳蕙, 高国伟. 国内外主要数据治理模型的比较与选择研究——基于DCMM、DAMA、DGI数据治理模型的分析[J]. 图书情报导刊, 2024, 9(10): 57-62.
[10] Abbott R J. Program design by informal english descriptions[J]. Communications of the ACM, 1983, 26 (11): 882-894.
[11]谭春平, 王烨, 申风平. 面向对象方法视角下基于第四方物流的物流园虚拟组织设计[J]. 经济与管理评论, 2020, 36(4): 77-91.
第一作者:孙学忠(1974—),男,汉族,高级工程师,主要从事海关信息化建设、架构管控、数据治理等工作,E-mail: 1833420224@qq.com
1. 中国电子口岸数据中心 北京 100011
1. China E-Port Data Centre, Beijing 100011
表1 数据管理框架比较[6-9]
Table 1 Comparison of data management frameworks[6-9]
名称 | 主要特点 | 优势 | 不足 |
DAMA | 以数据管理为主导, 数据管理的核心是数据治理, 解决了数据治理各项功能与环境要素的匹配问题. | 充分考虑到功能与环境要素对数据本身的影响, 并建立对应的关系. | 缺乏对数据资产管理的相关内容. |
DCMM | 企业可以清楚地定义企业内数数据管理能力水平, 并以模型为标准确定组织内数据改进方向. | 量化评估企业数据管理能力水平; 指明企业数据管理能力缺陷; 通用性较高. | 提出了数据管理应该具备什么能力, 但是并未指明应该怎么做, 落地效果不明显. |
白皮书 (4.0 版)》 | 是一套针对数据资产的管理体系, 引入了数据资产价值管理和运营等内容, 包括数据资产管理过程中的一些管理工具. | 偏重数据资产管理方面的国家标准;实践案例丰富, 可参考价值较高. | 偏重行业实践案例研究与风险, 理论指导性稍弱, 提出的时间较短, 企业验证较少. |
图1 面向对象视角下数据管理框架的映射关系
Fig.1 Mapping relationships of data management frameworks from an object-oriented perspective
图2 基于对象视角的数据管理框架
Fig.2 Data management framework based on an object-oriented perspective