CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
跨境贸易大数据平台数据治理及框架研究
作者:孙学忠1 胡 伟1*
孙学忠1 胡 伟1*
摘 要 数据治理可以提升数据管理效率,有助于数据价值实现和共享。跨境贸易大数据平台数据治理工作面临一些挑战。本文通过分析跨境贸易大数据平台数据治理需求和难点,借鉴主流数据治理框架研究成果,提出跨境贸易大数据平台数据治理框架,并对框架构成及要素进行介绍。
关键词 大数据; 数据治理; 数据治理框架
Research on Data Governance and Framework of Cross-Border Trade Big Data Platform
SUN Xue-Zhong1 HU Wei1*
Abstract Data governance can improve the efficiency of data management and contribute to the realization and sharing of data value. The data governance of cross-border trade big data platform is facing some challenges. By analyzing the data governance needs and difficulties of cross-border trade big data platform, this paper proposes the data governance framework of cross-border trade big data platform based on the research results of mainstream data governance framework, and then introduces the structure and elements of the framework.
Keywords big data; data governance; data governance framework
数据治理是决策制定与操作实施有机组合的体系,有效的数据治理活动可以提升组织内的数据管理效率,有利于数据的价值挖掘和共享利用[1]。 国外数据治理始于2004年企业管理中“数据仓库治理”的探讨[2]。目前,国内外在数据治理领域已经开展了大量有意义的研究工作, 例如:DAMA(国际数据管理协会)[3]、DGI(国际数据治理研究所)[4]、《信息技术服务 治理 第5部分:数据治理规范》 标准编号:GB/T 34960.5-2018(为方便下文论述,简称《数据治理规范》国标)[5]等;同时,数据治理理论及方法在企业、银行、政府等领域得到广泛应用[6-11]。
2015年,国务院印发《促进大数据发展行动纲要》,标志着大数据上升为国家战略[12]。大数据本身蕴含的价值为企业带来了商机,同时对传统的数据治理也提出了新的挑战。近年来有不少和大数据相关的数据治理研究,内容涵盖大数据治理框架、要素分析、机制和方法论等[13-20]。这些研究成果对在大数据环境下开展数据治理工作具有较好的借鉴意义。
为贯彻国务院深化“放管服”改革要求,根据《国务院关于印发优化口岸营商环境,促进跨境贸易便利化工作方案的通知》(国发〔2018〕37号)关于“建设跨境贸易大数据平台”的要求,中国电子口岸数据中心依托中国国际贸易“单一窗口”建设跨境贸易大数据平台,其中数据治理体系是重要建设内容之一。目前跨境贸易大数据平台的数据治理工作尚在规划设计阶段,研究跨境贸易大数据平台数据治理体系及框架,可以为后续跨境贸易大数据平台开展数据治理工作提供指导,通过数据治理活动,可以确保数据在安全、可控的前提下体现价值,为口岸监管和贸易便利化服务。
本文首先介绍数据治理的定义及作用,其次分析跨境贸易大数据平台数据治理的需求及难点,最后借鉴主流数据治理研究成果,提出跨境贸易大数据平台数据治理框架,并对框架要素进行说明。
1 数据治理的定义及作用
1.1 数据治理的定义
业界对于数据治理的定义存在多种表述,其关注点和内涵存在差异,截至目前仍未给出一个统一的定义。比较典型的定义如下:
DAMA:数据治理是指“对数据资产管理行使权力和控制的活动集合( 包括计划、监督和提升)”[3] 。
DGI:数据治理指的是对数据相关事宜的决策制定与权利控制[4] ,即根据约定模型实施决策,包括实施者、实施步骤、实施时间、实施情境以及实施途径与方法。
《数据治理规范》国标:数据治理是数据资源及其应用过程中相关管控活动、绩效和风险的管理集合[5] 。
为准确把握数据治理的定义,可以从3个方面来理解数据治理的概念和内涵[7] 。
(1)明确数据治理的目标。具体来说,数据治理要有顶层设计和决策机制,数据治理活动要有清晰的定义和产出,数据治理过程要始终处于规范、有序和可控的状态。
(2)理解数据治理的职能。从决策的角度,数据治理需要回答与数据相关的决策问题,即为什么(Why)、什么时间(When)、在哪些领域(Where)、由谁作决策(Who)及应该作哪些决策(What)[4];从具体活动的角度,数据治理的职能是“评估-指导-监督”(evaluate-direct-monitor,EDM) [13] ,即评估数据利益相关者的需求及内外部条件,明确治理目标,制定实施方案;指导数据治理实施,及时解决过程中存在的问题;基于预定目标和评价标准,监督数据治理的过程和绩效符合预期[7] 。
(3)把握数据治理的本质。数据治理的本质是对组织的数据管理和应用进行评估、指导和监督,通过数据治理活动,提升组织的数据管理能力,增强数据安全,降低数据使用风险,并通过数据应用为组织创造价值[7,13] 。
1.2 数据治理的意义和作用
数据治理活动对数据资产的促进作用已经被实践所证明[6] 。通过实施数据治理,可在以下方面获得收益[7] 。
(1)提升数据质量,提升数据分析可信度。数据分析的准确性来源于数据的质量。通过实施数据治理,可以促进数据标准统一,提升数据质量,进而增加数据分析结果的可信度。
(2)提升数据管理水平,节约成本。数据治理活动可以对数据管理的各个环节开展有针对性的改进措施,完善管理过程中的不足,优化管理措施,提升组织的数据管理水平。高效的数据管理减少了数据获取、分析、流通的总体费用,节约了组织成本。
(3)提高数据合规性,降低使用风险。数据的管理和使用必须在国家法律法规和行业标准规范框架下执行,合理的数据治理活动可以确保组织的数据管理合规合约。通过开展必要的数据安全治理活动,可以有效降低数据非法访问、隐私泄露等风险。
(4)提升数据价值。数据治理活动可以提升数据质量,基于高质量数据基础上的数据挖掘才能产生准确和可信的分析结果,为企业带来盈利和价值。
2 跨境贸易大数据平台数据治理现状分析
2.1 数据治理需求概述
跨境贸易大数据平台数据治理的主要建设目标是制定系统化的数据管理制度、流程和方法,实施数据资源管理、数据质量管理、元数据管理、生命周期管理等。目标本身包括三方面内容。
(1)构建数据治理框架,合理配置数据治理要素。构建适用的数据治理框架,并在框架范围内,有序、有效地开展数据治理活动,确保数据的收集、开发、应用等活动在合规、安全的前提下开展,同时保障数据安全,降低数据泄露和非法访问等风险。
(2)完善和制定数据治理相关的流程、规范和方法,为数据治理活动提供保障。吸纳本单位已有的部分建设成果,如数据元管理规范、数据安全相关的管理制度等,完善补充数据治理流程、数据资产管理等技术制度。
(3)在数据层面,完善数据标准,提升数据质量,促进数据价值实现。通过有效的数据治理活动,完善和补充现有的数据标准,提升数据质量,规范模型设计,确保数据挖掘和分析结果的可信度,更好地服务于贸易便利化和口岸监管。
2.2 实施数据治理工作的主要问题
在进行数据治理工作规划过程中,我们发现推进数据治理工作存在两方面的问题。
(1)数据治理框架的选择及要素取舍。构建数据治理体系的基础工作是构建数据治理框架[7]。目前业界没有一个统一的、通用的数据治理框架,此外各单位数据治理的关注点也不尽相同,因此需要结合自身的内外部环境和数据治理需求,制定适用的数据治理框架,明确框架要素构成,用以指导数据治理实施。
(2)数据本身存在的问题。数据问题主要体现在三方面:
①数据标准不统一。跨境贸易大数据平台的数据主要来自于进出口贸易相关方的交易数据。由于数据的来源不同,其数据标准和存储格式也存在差异。数据标准不统一,导致数据的准确性存在问题,影响数据分析和共享的质量。
②数据质量需要提升。一方面,从个别系统汇聚的数据质量有待提升;另一方面,由于大数据的实时性要求,需要提高数据的访问速度,为减少数据传输,相同的信息会在不同系统之间进行冗余存放,导致数据的更新存在滞后和不一致,影响数据质量。
③数据安全及隐私保护问题。 跨境贸易大数据平台在方便数据挖掘、应用的同时,也增加了数据的透明度。一些敏感隐私的数据存在被泄露或非法使用的风险,给数据的安全与隐私保护带来严峻的挑战。
综上分析,要实现跨境贸易大数据平台数据治理的目标,解决好所面临的问题,应树立数据治理思维,借鉴已有数据治理研究成果,构建适用的数据治理框架以指导后续的数据治理活动。
3 跨境贸易大数据平台数据治理框架规划
3.1 数据治理框架的概念
数据治理框架是指“为了实现数据治理的总体战略和目标,将数据治理领域所蕴含的基本概念( 如原则、组织架构、过程和规则等),利用概念间关系组织起来的一种逻辑结构”[7]。数据治理框架描述了数据治理领域的组件以及组件间的逻辑关系。引入数据治理框架的目的是为组织开展数据治理活动提供指导,确保数据治理活动能够达到预期的目标。数据治理框架是构建数据治理体系的基础和前提。
数据治理框架通常需要明确如下内容[7]: 各个组件的职能以及组件间的逻辑关系;组织架构和职责分工;数据治理的工作范围和重点;数据治理的活动和流程;数据治理成效的评估方法和标准。
3.2 主流数据治理框架
当前业界已有一些比较完整的数据治理框架,这些框架可以为组织的数据治理工作提供一些参考。比较有代表性的框架有DAMA框架、 DGI框架、《数据治理规范》国标参考框架[7,13,17]。
(1)DAMA数据治理框架
DAMA从数据管理的视角,将数据管理分为十大功能[3],包括:数据治理、数据架构管理、数据开发、数据操作、数据安全、主数据、数据仓库和商务智能管理、文档和内容管理、元数据管理、数据质量管理。对于数据治理相关的7个要素也做了阐述,包括:目标和原则、活动、主要交付物、角色和责任、技术、实践和方法、组织和文化。DAMA数据治理框架认为,数据治理职能是数据管理的核心,指导其他数据管理职能的执行,在数据管理职能中处于上层位置。数据治理的重点就是解决十大职能与七大要素之间的匹配问题。
(2) DGI数据治理参考框架
DGI认为数据治理不同于数据管理。它从人员与组织结构、规则与协同规范、过程3个层面对数据治理的10个关键活动进行了说明[4]。该框架包含了管理相关的促成因素(如组织、利益干系人、目标等),同时也具有详细的实施方法论。DGI框架是一个从方法到实施的完整系统[7]。
(3)《数据治理规范》国标参考框架
《数据治理规范》国标参考框架包括顶层设计、政策支持、治理活动、工作流程、技术支撑四个子框架[5],共包含11个组成部分。考虑到标准的普适性,它对数据治理的原则、总体目标等做了约束,提出了各个要素的功能需求,对于个性化的内容,如组织和角色设定、开展数据治理活动的实施细节等没有明确界定。
(4)三个治理框架的比较
以上三个框架的比较如表1所示。
表1 数据治理框架比较
Table 1 Comparison of data governance frameworks
框架名称 | 提出者 | 数据治理内涵 | 框架组成 | 差别 |
DAMA数据治理框架 | DAMA | 数据治理是指对数据资产管理行使权力和控制的活动集合( 包括计划、监督和提升)[3] ,是数据管理的核心和顶层功能,指导其他数据管理功能的执行。 | DAMA 数据治理框架包括10个功能和7个要素。 | 架构完备,内涵丰富。 |
DGI数据治理框架 | DGI | 数据治理指的是对数据相关事宜的决策制定与权利控制,是处理信息和实施决策的一个系统。 | DGI 数据治理框架包括规则、人员与组织机构、过程三大部分,共 10 个小部分。 | 框架独立性好。 |
GB/T 34960 5 数据治理参考框架 | 全国信息技术标准化技术委员会 | 目标:确保数据及应用过程中的运营合规、风险可控、价值实现。 | 包括顶层设计、数据治理环境、数据治理域、数据治理过程四大部分。每个部分由不同的要素组成。 | 框架简单、直观。 |
DAMA数据治理框架内容相对比较丰富。DGI框架最明显的特点是它认为数据治理和数据管理是相互独立的,前者负责决策,后者负责执行和反馈,从数据治理角度看,框架本身的独立性比较好。《数据治理规范》国标参考框架比较直观、简单,它对于数据治理目标的定义与跨境贸易大数据平台数据治理的关注点基本一致,其数据治理域内容和跨境贸易大数据平台数据治理的内容基本一致。
这3个框架对于制定跨境贸易大数据平台数据及治理框架都具有重要的参考意义。
3.3 跨境贸易大数据平台数据治理框架
跨境贸易大数据平台有比较明确的建设内容和关注点,因此数据治理工作体现出一定的特殊性,通用的数据治理框架不完全适用。通过对跨境贸易大数据平台数据治理需求及问题的分析,借鉴主流数据治理框架的研究成果,笔者提出跨境贸易大数据平台数据治理实施框架,框架包括促成因素、治理内容、实施方法3个子框架。促成因素描述了数据治理成功所需的必要条件,治理内容表明了数据治理工作实施的范围和对象,实施方法说明了数据治理活动实施的方法论,框架构成如图1所示。
3.3.1 促成要素
促成要素明确了数据治理取得成效的必要条件,是数据治理工作开展的基础[7]。包括战略和目标、组织与角色、流程与活动、内外部环境、技术与工具5个要素。
(1)战略与目标。鉴于跨境贸易大数据平台的数据治理需求及面临的问题,本框架将数据治理的目标总结为运营合规、风险可控和价值实现,即在符合国家法律法规和海关相关制度规范的前提下,通过有效的数据治理活动,降低风险,防止数据非法访问和隐私泄露,避免决策失误和经济损失,促进数据价值的实现。
(2)组织与角色。 结合单位实际情况,组建数据治理组织架构,设定角色及岗位,明确职责与权限,通过各职能部门之间的协作,实现数据治理的预定目标。
(3)流程与活动。流程是数据治理活动的最优实施路径,关注治理目标,流程强调规范和可控。活动是实际的数据治理工作内容,是数据治理工作的控制点和反馈点。
(4)内外部环境。内外部环境是数据治理所处的内部与外部环境,如政策法规、行业规范、市场需求与竞争力等[5,13]。开展数据治理工作,要求组织内部要具备数据治理意识,适应数据治理相关的政策环境、技术环境、战略环境等,逐渐形成组织的数据治理氛围,并以此来促进组织内数据治理工作的落实。
图1 数据治理框架
Fig.1 Data governance framework
(5)技术与工具。选择合适的工具和技术来支撑数据治理活动,通过信息化手段实现数据治理,如元数据收集展示、数据标准制定及数据关联、数据质量探查和处理;不同角色之间的沟通及任务申请、审批等流程,也可以通过工具来支撑。
3.3.2 治理内容
治理内容子框架明确了数据治理的范围和具体内容,分为两个层面:价值实现层和数据保障层。
(1)价值实现层。价值实现层的主要目的是在合规、风险可控的前提下,确保数据价值的实现和数据共享。
①数据服务。跨境贸易大数据平台为不同用户提供基于大数据的应用和服务,这些应用和服务需要在合规、风险可控的前提下进行。数据服务相关的治理活动内容包括数据服务目录的制定和维护、数据服务需求、数据服务实现、数据服务管控、数据服务支持、数据服务能力评估及改进等相关环节的流程、方法和反馈等。
②数据共享。数据共享相关的治理活动的主要内容包括数据资产的识别和鉴定;根据国家法律法规和海关制度,确定数据共享的范围、方式;根据数据安全访问要求,制定数据分类分级制度,确保跨境贸易大数据平台的数据在安全可控的前提下被访问;制定数据访问日志和审计机制,实现数据访问溯源等。
(2)数据保障层。数据保障层治理活动包括元数据、数据标准、数据质量、数据安全、数据生命周期等。
①元数据。元数据是数据描述、管理、发现、定位的基础,它从基础层面保障数据的完整性、规范性和一致性。跨境贸易大数据平台元数据治理的内容就是完善和补充元数据内容和管理制度,让元数据在数据资产管理、数据应用等方面发挥作用。同时结合WCO数据模型,持续完善数据描述、格式定义等规范,形成更加完备的元数据资产。
②数据标准。 跨境贸易大数据平台目前数据存在标准不统一的问题,造成数据转换和分析的成本增加。通过对数据标准开展治理活动,完善数据规范,完善管理制度和反馈机制,落实责任分工,强化数据规范的执行力度,并通过技术手段保障数据标准落地。
③数据质量。由于数据来源的多样性,跨境贸易大数据平台的数据质量存在差异性,直接关系到数据分析的准确性和可信度。通过对数据质量开展治理活动,制定和形成数据质量管理目标,构建数据质量评估要素和方法,明确职责分工,确定流程和方法,通过技术手段对数据进行质量探查,处理不合规数据,从根本上保障数据的准确性、完整性、一致性、可访问性等[7]。
④数据安全。跨境贸易大数据平台上汇聚了全链条的进出口相关数据,任何的数据泄露和非法访问都可能带来严重的后果。跨境贸易大数据平台须在海关数据安全相关制度规范围内,针对数据安全管理开展治理活动,细化数据分级分类,强化数据访问和审计,完善数据安全规范和制度,确保数据在安全、可控的前提下使用。通过实施数据治理活动,达到运营合规、风险可控的目标。
⑤数据生命周期。跨境贸易大数据平台上汇集的数据本身具有一定的生存周期。实施数据生命周期相关的治理工作,就是要强调数据治理工作始终贯穿在大数据处理相关的所有环节,从数据采集、存储、整合、处理与分析、应用与呈现到归档与销毁的全生命周期内,进行持续的治理和优化。
3.3.3 实施方法
实施方法子框架包括评估和规划、指导和监督、评价和改进。
(1)评估和规划。针对具体的数据治理活动,参考DCMM标准[21],对治理对象进行成熟度评估,分析现状、水平和差距,识别数据治理的改进路径,制定具体的数据治理实施方案。
(2)指导和监督。职能部门根据数据治理方案开展数据治理活动。数据治理团队对数据治理过程进行监控,及时解决工作中存在的问题,确保整个治理过程在规划的框架内进行。
(3)评价和改进。数据治理活动结束后,对数据治理的成效进行评价,提出问题和改进方向。另外,还可以考虑引入必要的审计工作,对数据治理的过程是否合规做独立审计[7]。
4 结语
数据治理工作可以提升数据管理效率,有利于跨境贸易大数据平台数据价值挖掘和共享。本文参考和借鉴当前主流数据治理框架研究成果,提出跨境贸易大数据平台数据治理框架,该框架能够涵盖跨境贸易大数据平台建设对于数据治理的需求,可以解决数据治理工作面临的挑战。数据治理是一个系统的、与实践密切相关的工作,其目的、内容、方法等会随着内外部环境的变化而进行调整。在今后的工作中,应基于数据治理成效,及时反馈,改进和优化数据治理框架及相关要素,以确保跨境贸易大数据平台更好地服务于口岸监管和贸易便利化。
【该文经CNKI学术不端文献检测系统检测,总文字复制比为11.1%。】
通讯作者:胡伟(1973&— ),汉族,福建人,技术管理部主任,主要从事大数据架构规划、架构管控、技术管理等工作。E-mail: Huwei@chinaport.gov.cn
1. 中国电子口岸数据中心 北京 100088
1. China E-Port data centre, Beijing 100088
参考文献
[1]刘桂锋,钱锦琳,卢章平.国外数据治理模型比较[J].图书馆论坛, 2018, 38(11): 18-26.
[2]刘桂锋,钱锦琳,卢章平.国内外数据治理研究进展:内涵、要素、模型与框架[J].图书情报工作, 2017, 61(21): 137-144.
[3] DAMA International. DAMA数据管理知识体系指南[M].北京:清华大学出版社, 2016. DMBOOK
[4] Data Governance Institute. The DGI data governance framework.http://www.datagovernance.com/wp-content/uploads/2014/11/dgi_framework.pdf
[5]中国电子技术标准化研究院 , 深圳赛西信息技术有限公司,上海计算机软件技术开发中心,等 . GB/T 34960.5-2018 信息技术服务 治理 第 5 部分 :数据治理规范 [S]. 北京 : 中国标准出版社 , 2018.
[6]张绍华,潘蓉,宗宇伟.大数据治理与服务[M].上海:上海科学技术出版社, 2016.
[7]包冬梅,范颖捷,李鸣.高校图书馆数据治理及其框架[J].图书情报工作, 2015, 59(18): 134-141.
[8]陈芳.企业实施数据治理的核心内容及条件保障[J].信息资源管理学报, 2018, 8(04): 35-40.
[9]臧其事,袁益中,崔中华.数据治理在银行业的应用[J].电子技术与软件工程, 2018(22): 163-164.
[10]刘顺春.“共享中国石油”中的数据治理体系研究[J].北京石油管理干部学院学报, 2019, 26(06): 21-29.
[11]王金水,张德财.以数据治理推动政府治理创新:困境辨识、行动框架与实现路径[J].当代世界与社会主义, 2019(05):178-184.
[12]中华人民共和国国务院.促进大数据发展行动纲要[J].成组技术与生产现代化, 2015, 32(3): 51-58.
[13]杨琳,高洪美,宋俊典,张绍华.大数据环境下的数据治理框架研究及应用[J].计算机应用与软件, 2017, 34(04)65-69.
[14]郑大庆,黄丽华,张成洪,张绍华.大数据治理的概念及其参考架构[J].研究与发展管理, 2017, 29(04): 65-72.
[15]郑大庆,范颖捷,潘蓉,蔡会明.大数据治理的概念与要素探析[J].科技管理研究, 2017, 37(15): 200-205.
[16]甘似禹,车品觉,杨天顺,吴俊伟.大数据治理体系[J].计算机应用与软件, 2018, 35(06):1-8+69.
[17]张绍华,杨琳,高洪美,宋俊典.《数据治理规范》国家标准解读[J].信息技术与标准化, 2017(12): 25-29.
[18]张豹,陈渊.大数据环境下数据治理框架的特点及应用[J].电子技术与软件工程, 2019(16): 162-163.
[19]安小米,郭明军,魏玮,陈慧.大数据治理体系:核心概念、动议及其实现路径分析[J].情报资料工作, 2018(01): 6-11.
[20]丁晓平.大数据时代商业银行数据治理[J].中国银行业, 2019(11): 26-28+6.
[21] 中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.数据管理能力成熟度评估模型[S]. 2018.
(文章类别:CPST-A)