CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
应用世界海关组织数据模型构建智能边境信息框架探究
作者:王翔 李志鹏 刘萤 关荣
王翔 李志鹏 刘萤 关荣
在我国数字贸易加速发展的背景下,跨境数据链和数字技术成为我国加强国门安全管控、促进贸易便利的重要措施[1-3]。从国际层面来看,近年来世界海关组织(WCO)通过对全球海关智能化水平的持续跟踪,积极倡导各国口岸部门通过数据挖掘和共享,应对各类非法贸易和海关作业系统面临的网络安全风险,并在确保安全是发展的前提下简化口岸程序,实现边境监管手段智能化、协同监管智能化、跨境合作智能化,通过投入数据要素优化监管部门之间、政企之间、国家(地区)之间的跨境协作[1-4]。近年来,联合国、世界贸易组织、陆海空铁邮等物流领域以及工业、农业、金融等领域的国际组织陆续与WCO合作,以WCO数据模型(WCO DM)为标准框架,通过共建数据模型标准、开展数据标准映射等形式,为各国政企跨境数据链合作提供指导和技术工具[5-6]。截至2021年9月,全球73.8%的WCO成员已采标、部分采标或者映射(Mapping)使用该模型,基本覆盖所有实施“单一窗口”的国家(地区)[7],因此WCO DM成为构建智能边境时需要认真评估的技术选项。
1 理论分析
1.1 信息增益分析
由于业务范围、数据来源等不同,口岸部门之间的数据内容可能不一致,进而影响各自执法决策。为此,可以采用公式(1)的信息熵和公式(2)的信息增益率,对数据质量进行先验评价。其中,为样本总量中部门(,)的比例;同一个监管数据元可能存在个取值,取值差异会进一步分化监管决策分支,并且考虑到同一口岸部门不同监管阶段采集的数据元不同(如登记备案、初次申报、正式申报、补充申报所需数据元数量差异),为了减少对于取值数量较多类别的结果偏好,引入固有值,按照公式(2)的信息增益率进行评价[8]。
,(1)
(2)
实务中,跨境贸易通常监管链条相对境内更长,涉及多国、多部门,为了尽可能提升跨境全过程监管效能,结合公式(1)和公式(2)可得出如下推定。
推定1:规范取值。对于特定数据元而言,尽管存在多个取值,口岸部门和进出口企业之间应采用标准代码降低,提高监管决策显性程度。
推定2:避免重复采集。重复采集相同数据元容易出现不一致,特别是当各方独立采集相同样本规模的相同数据元时,即时,H最大,对于决策干扰最大。
推定3:尽可能一次提取。降低重复偏差,减少信息熵,提高数据的确定性。
结合推定1~3,应建立口岸部门之间的数据协调机制,并满足以下条件:
推定4:推定1规范监管主客体表达,确保各数据元首采集部门按照规范方法规范取值。
推定5:推定2及时共享数据,作业流程下游各部门信任并重用上游部门共享的数据。
推定6:推定3各数据元尽可能一次采集,按需分发各口岸部门。
1.2 WCO DM技术特征分析
对照智能边境倡议,WCO DM作为一系列跨境贸易相关数据标准的结合体,定位于统一跨境数据语言、多部门协作工具和技术标准工具箱,不仅充分契合智能边境立意,而且符合数据增益推定4~6的要求。
实践中,WCO DM的数据元以《经修订的京都公约》(RKC)为业务基础[1]。由于各国口岸部门业务范围差别较大,因此数据元梳理总体体现出信息熵的消减过程[8]:1)WCO向各成员征询的全量数据元通过类似协调系统(HS)的汇总过程形成原始数据集;2)遵循推定1,将可枚举的数据元采用代码表(Code List)进行规范;3)遵循推定2~3,厘清口岸部门之间、政企之间的冗余数据元,将清洗后的数据元汇总为协调数据集(Data Set),覆盖跨境贸易的申报(B2G)、监管协同(G2G)、回执(G2B)3类过程。
2 智能边境信息框架设计
2.1 数据元建模
为了减少不同业务场景下的建模工作量,WCO DM采用超类(Super Class)扩展方式,能够结合业务场景将超类具象化为实体类[1]。无论是超类还是实体类,属性均从协调数据集中提取。对于自然语言表述中的5W1H(Why、What、Who、When、Where、How)要素,WCO DM不设置原由要素(Why),该内容应该由联网各方在技术实施前确定,其他4W1H要素WCO DM通过6个超类进行抽象建模[5-6]。
1)RootDocument类:表示单证和凭据,是口岸信息系统的加工对象,代表“What”。通常法律、监管、商业活动的时效落实为单据凭证,因此 “When”的内容作为其属性。
2)GovernmentAgency类:表示政府部门,代表“Who”。
3)Party类:表示非政府性机构,包括贸易、金融、物流等企业,代表“Who”。
4)Location类:表示活动发生地点,代表“Where”。
5)TransportMeans类:表示跨境活动的流程、作业,代表“How”。
6)Person类:表示人员,代表“Who”。1所示,超类中已经定义的属性在实体类无需重复定义,实体类作为对超类的具象化表示,只要附加扩展属性即可,因此建模工作得以简化。遵循推定1,为了提高交换数据的标准化程度,各个属性尽可能使用标准代码表,人员、机构、运输工具、商品等也尽可能使用标准标识(Identifer),并将动态的流程和静态的属性进行分离,进一步加强数据元重用。此外,为了降低跨境联网技术复杂性,实现平台、软件产品的技术中立性,WCO DM中所有属性均引用统一的核心数据类型(Core Data Types),确保所有数据元中数量、文字、名称、代码、标识的数据类型规范性[5-6]。
2.2 信息包建模和裁剪
互联互通项目中需要根据双多边协定对协调数据集、实体类、属性进行裁剪,为提高数据质量,根据推定4不仅要确定数据内容,还需要限定数据规则(rule)和处置规程(method),因此1所示,WCO DM引入信息包(IP),采用“套装”的数据解决方案简化技术实施。截至2023年3月,WCO官方已支持申报、旅检、“单一窗口”、寄递、海运、暂准进口、原产地、文物等19个监管主题;对于尚未支持的主题,各方也可以选取基础信息包(Base IP)或者近似的扩展信息包(Derived IP),从产业、区域、国别、语种等维度扩展自定义信息包(My IP);跨国企业也可以根据业务发展,编制自身的My IP。借助信息包,大部分双多边项目仅需要根据协定内容,选取既有信息包裁剪即可[5-6]。
以国际铁路货运通关为例,合作初始阶段可能仅涉及铁路货运的申报及回执交换,参与方也仅包括海关、铁路两个部门(G2G)及进出口企业(B2G、G2B),而且数据规则、处理规程遵循WCO相关指南[9],因此仅需要对WCO的“申报”信息包进行裁剪[5-6]。
2.2.1 裁剪类
如图2所示,申报信息包中包括申报(Declaration)等数十个类,而该阶段跨境铁路货运申报仅需要图3的8个类:申报(Declaration)、申报唯一编号(UCR)、承运人(Carrier)、包装(Packaging)、运输方式(BorderTransportMeans)5个类记录基本信息,而设施位置(CargoFacilityLocation)、承运人员(CrewMember)和运输工具所有人(Master)3个类则用于开展风险防控和信用评估。
2.2.2 裁剪属性
图3中8个类的属性(数据元)总数近120个,填制、交换、审核依然较为复杂。为了进一步聚焦跨境铁路货运申报需要,降低海关、铁路、进出境口企业负担,可采用贴近自然语言的表述需要,对属性做进一步裁剪后仅保2个,如图4所示。
1)What:通过Declaration类的总毛重(Total gross weight)和Packing类的包装种类(Type of packages identification, coded)记录货物总体情况。
2)Who:包括Master类、Carrier类以及CrewMember类的基本信息。
3)When:由于跨境贸易中时间是法律、商业、金融等活动的重要依据,因此除了Declaration类的签发日期(issuing date),还包括BorderTransportMeans类的启运日期(Departure date and time)、初次抵港日期(进入关境)(Date and time of arrival at first port of arrival in Customs territory)以及运输工具建成年份(Built year of Conveyance)等关键事件节点。
4)Where:与时间类似,地点也是重要依据,因此采用CargoFacilityLocation类以及BorderTransportMeans类的首次抵运岗属性(First port of arrival, coded),从东道国口岸部门角度记录关键位置数据。
5)How:而具体跨境物流活动则主要由BorderTransportMeans类的必要属性记录。
2.2.3 集成检验检疫数据模型
按照联合国贸易便利化和电子商务中心(UN/CEFACT)的33号建议书《关于建立“单一窗口”的建议和准则》和36号建议书《“单一窗口”互操作》,为了降低企业的单证成本和时间成本,通常将检验检疫单证以随附单证(LPCO)的形式,通过“单一窗口”与报关单、物流单证、订单等电子数据一次性提交。WCO DM使用RootDocument类定义并扩展检验检疫单证,同时提供部分合作主题的信息包。商品检验所需的部分数据元、信息包在WCO DM设计之初已经包括在报关单、物流单证、订单的定义中,使用较为普遍、成熟;在食品安全、动植物检疫方面,截至2023年3月已支持的电子证书包括《国际食品法典》(CODEX)、植物检疫(IPPC ePhyto)、世界动物卫生组织(WOAH);卫生检疫目前在WCO DM中没有独立的数据元和信息包,通常需要自定义数据元后,集成到旅客及运输工具驾驶人员、乘务人员信息包(API/PNR),而且运输方式暂时支持海运、空运、铁路运输3种,公路运输尚无可集成的信息包。
2.3 设计信息框架
考虑到口岸信息化范围广泛,特别是智能边境涉及的跨部门协调内容庞杂、主题众多、数据协调紧密,而且需要根据国际经贸合作态势动态变化,不同申报主体的申报数据(如报关代理机构、运输工具负责人等)、甚至同一申报主体不同类型的申报内容(如报关代理对一般贸易和跨境电商的申报)均需要对WCO DM进行裁剪,而且各国口岸部门的法律法规、商业风俗、机构职责、监管要求、信息技术应用水平不同,因此裁剪要求也存在差异,参考WCO的项目管理方法论[10建议采用图5所示的工作组织方式,持续迭代图2、图3、图4的裁剪步骤,逐步建立并维护智能边境的信息框架。
2.4 系统间数据对接
在具体合作项目磋商过程中,为了提高效率,可以根据表1中WCO汇总的部分国家(地区)口岸系统中WCO DM类或属性的使用情况,结合各方数据元并集,确定类似图3、图4的裁剪过程,充开发部分功能。如表1所示,如开发远东地区国家间铁路合作项目,在一般贸易代理报关场景下,各方关于货物总体情况、流程作业情况可以采取图图4的方式裁剪,但根据表1评估(*号部分),部分国家的海关、铁路部门还需要扩充报关代理及其联系信息的共享交换功能。
3 口岸部门协同设计
构建智能边境需要依靠口岸部门之间的数据协同实现业务协同,其中数据标准的重要性凸显出来。如图6所示,假设国际贸易涉及的贸易、物流、金融和口岸部门共n家,其中可能涉及的数据标准(或标准集)共m项,3种典型的全连通模式复杂度分别为:
1)模式1:没有可遵循的技术标准,各方点对点协调互联。整体复杂度。
2)模式2:有m个数据标准(或标准集),各方采用己方特定的数据标准(或标准集)构建自身信息系统,然后借助不同数据标准(或标准集)之间的映射完成互联互通,整体复杂度,数据标准之间的转换通常较烦琐。由于跨境贸易参与主体(企业、口岸部门、代理机构等)数量通常大于数据标准数量(),因此模式2的复杂度相对模式1更低。
3)模式3:各方采用数据标准,数据标准化机构之间预先完成映射,并作为标准的一部分发布。在此情况下,所有数据标准可以视为1个整体,无论各方选择何种数据标准(或标准集),均可以实现与其他()方的双向互联互通,整体复杂度为1,是整体复杂度最低的方案。
图6中表示参与方,表示数据标准。它表明如果借助数据标准,更易于实现特定行业、特定区域、特定国家(地区)数据交换的规范和便利;跨数据标准的映射[1],则更易于打破特定行业、国家(地区)之间的技术壁垒,构建更加全球化的数字生态,服务智能边境、智能政府、智能社会等更广泛的数字化环境。
当前,联合国、部分地区性国际组织(如欧盟)以及陆海空铁邮、农林牧副渔等众多领域的国际组织持续投入,将自身数据标准与WCO DM的跨数据标准映射合作[1],因此采用WCO DM之后,口岸部门之间的数字化协同可以在多套国际技术标准层面实现互操作,技术聚集效应明显,复杂度也逐步从模式1、模式2向更低的模式3转变,降低实施和维护成本,如果配合“单一窗口”等跨部门业务汇聚平台,则利于实现各国家(地区)政企双方的便利协作。
4 结论
WCO DM不仅是一组数据元,更是推进智能边境实施的工具箱,随着联合国、各相关国际组织的加入,围绕WCO DM已经成长为一个覆盖跨境贸易的数据生态,更易于设计口岸部门之间联合防控、政企贸易便利合作的信息框架。但这意味着所需能力要求相应提高,除了需要专门的信息化工程人员和数据模型专家以外,还需要关务、法律、外事、物流、商贸、农林牧副渔、卫生健康等多个业务领域人员的参与,以WCO DM为载体,实现智能边境数据业务化、业务数据化。
参考文献
[1] OMD. CADRE DE NORMES SAFE DE L’OMD [J/OL] Brussels: OMD, 2021, [2023-02-10]. http://www.wcoomd.org/-/media/meeting-documents/permanent-technical-committee/231/pc0654eaf1.pdf:19.
[2] MFA. Concept Note on The Smart Customs, Smart Borders and Smart Connectivity Cooperation[R]. Beijing: GACC, 2022: 3-4.
[3]王翔. 建设数字政府国际段 更好服务“一带一路”走出去[J]. 党政信息化参考, 2021, 3(3): 30-4.
[4] MIKURIYA K. Message de l’Organisation mondiale des douanes Journée internationale de la douane 2019[EB/OL]. 2019(2019-01-25)[2023-02-10]. https://www.wcoomd.org/-/media/wco/public/global/pdf/about-us/international-customs-day/2019/message-from-the-wco-secretary-general-fr.pdf..
[5] WCO. Introduction to the WCO Data Model [DB/OL]. 2022, [2023-02-10]. http://www.unece.org/fileadmin/DAM/trans/doc/themes/UNDAC2C/Geneva2016/George200616_1.pdf:1-12.
[6] OMD. Application du Modèle de données [EB/OL]. (2021-12-19)[2023-02-10]. OMD. https://datamodel.wcoomd.org.
[7] OMD. État d’avancement de l’adoption du Modèle de données de l’OMD à l’échelon mondial [J/OL] 2021, (2021-09-08)[2023-02-10].http://www.wcoomd.org/-/media/meeting-documents/data-model-projects-team/61/pd0066f.pdf:2-3.
[8] SINGHVI S, MANKAR P D. Coding Gain for Age of Information in a Multi-source System with Erasure Channel[J]. arXiv preprint arXiv: 221211489, 2022: 1-5.
[9]王翔. 铁路通关便利化互联互通框架研究[J]. 北京: 铁道运输与经济, 2022, 44(6): 8-12.
[10] WCO. Project Management in a Customs Environment [DB/OL] 2022, (2021-09-08)[2023-02-10]. https://clikc.wcoomd.org/course/view.php?id=1688.
图1 WCO DM数据组织结构[1]
Fig.1 Data organization structure of WCO DM
图2 裁剪前的申报数据结构(为简化保留一级关联类)
Fig.2 Declaration data structure before tailoring (level-1 association classes retained for simplicity)
图3 裁剪后的申报数据结构
Fig.3 Declaration data structure after tailoring
图4 类裁剪和属性裁剪后的申报数据结构
Fig.4 Declaration data structure after classes and attributes tailoring
图5 应用WCO DM建立智能边境信息框架的工程组织
Fig.5 Construction organization for Smart Borders information framework with the application of WCO DM
表1 对一般贸易和舱单申报信息包中类和属性的裁剪(节选)
Table 1 Classes and attributes tailoring for information package of general trade and manifest declaration (example)
类或属性名称 | 美国 | 俄罗斯 | 欧盟 | 日本 | 韩国 | 尼日利亚 |
申报 | ||||||
总额 (发票金额) | ASESI | |||||
总毛重 | CSI | ASESI | ECS | AHR | KMS | eM |
报关单/代理* | ||||||
代理名称 | KMS | |||||
代理编号 | ||||||
报关单/代理/联系地址* | ||||||
城市 | KMS | |||||
国别代码 | KMS | |||||
街道/邮箱 | KMS | |||||
邮编 | KMS | |||||
报关单/代理/联系人* | ||||||
联系人 | KMS | |||||
联系人部门 | KMS | |||||
报关单/代理/联系方式* | ||||||
联系代码 | KMS | |||||
联系代码类型 | KMS | |||||
报关单/贸易方式 | ||||||
运输方式 | CSI | ASESI | ICS | AHR | KMS | eM |
运输方式代码 | ||||||
运输工具代码 | CSI | ASESI | ICS | KMS |
注: 资料来源于世界海关组织(WCO); 表中英文内容为经济体口岸作业系统简称
图6 通过数据标准构建互联互通
Fig.6 Interconnectivity based on data standards
基金项目:海关总署科研项目(2022HK141)
第一作者:陆冠亚(1981—),男,汉族,江苏常熟人,硕士,高级兽医师,主要从事进出口动物检疫、动物源性成分及动物物种鉴定工作,E-mail: 2643551374@qq.com
通信作者:赵晓燕(1972—),女,汉族,山西运城人,硕士,高级兽医师,主要从事进出口动物检疫、动物源性成分及动物物种鉴定工作,E-mail: 107168686@qq.com
1. 南京海关动植物与食品检测中心 南京 210019
1. Animal Plant and Food Inspection Center of Nanjing Customs District, Nanjing 210019