CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
信息熵方法评估海关生成式人工智能研究
作者:王翔
王翔
摘 要 世界海关组织(World Customs Organization,WCO)报告显示,生成式人工智能(Generative Artificial Intelligence,GAI)将逐步成为各国海关的技术选择。以信息熵作为量化评估措施,可以分析不同GAI场景的适应性,比较海关不同合作方案中的技术架构。分析显示,单独采用外部经贸语料库或通用语料库,在考虑资源投入和数据安全性的前提下,适用的应用场景较少,仅大致符合“调查研究”1个场景的需要;通过组合内外部合作方式,查询外部GAI模型获得特征标签、参数的方式,不仅资源投入较低,也能够大致覆盖WCO列举的各个场景。借助必要的微调措施,可以将GAI融入海关信息化整体环境,构建GAI为基础的新型生产力。
关键词 智慧海关;信息熵;大模型(LM);生成式人工智能(GAI);世界海关组织(WCO)
Research of the Evaluation of Customs Generative Artificial Intelligence with Information Entropy
WANG Xiang 1,2
Abstract According to a report bythe WCO, the Customs community will increasingly adopt generative artificial intelligence (GAI) technology. Information entropy, as a quantitative evaluation metric, can be used to assess the adaptability of various GAI scenarios and compare alternative technologicalframeworks under different Customs collaboration models. The results demonstrate that employing external economic and trade corpus or general corpus alone, while taking into consideration resource investment and data security, results in limited applicable scenarios, roughly meeting the needs of only one scenario labeled as “investigation and research”. However, with the collaboration of internal and external artificial intelligence (AI) resources, particularly by querying external GAI models to obatain domain tags and parameters, not only is the resource investment relatively low, but it can also roughly cover the many scenariosenumerated by the WCO report. With proper fine-tuning, GAI can be integrated into Customs’ IT environment, allowing for the creation of new types of productive forces based on GAI.
Keywords smart Customs; information entropy; Large Model (LM); Generative Artificial Intelligence (GAI); World Customs Organization (WCO)
海关的执法环境处于国家间物流、资金流、人流、信息流“四流”的交汇点,面对复杂多变的国际形势,海关执法职能总体不断增加,需要持续投入更多监管资源。近年来,随着生成式人工智能(Generative Artificial Intelligence,GAI)技术的日益普及,如何利用高效、智能的自然语言交互方式,辅助关员把关服务,已成全球主要经济体海关竞相研究的热点[1]。2023年11月,世界海关组织(World Customs Organization,WCO)发布了《海关生成式人工智能政策说明》(以下简称《政策说明》),梳理了GAI在海关可能的适用场景,并且从执法一致性、严肃性角度,分析该技术在海关场景中的限制、风险等[1]。为审慎评估、科学应用该技术,同时控制投资风险,海关需要对适合的应用场景以及对外合作时采取的技术架构进行研判,因此如何设计评估措施就成为需要研究的问题。
1 研究背景
GAI因其通过自然语言而不是计算机语言与人类进行熟练互动而得到广泛认可[1]。WCO认为,海关应用GAI之前应明确一项核心原则——GAI既不会思考,也不会读取、写作、绘制,GAI对其产出物的内在意义没有概念,而是通过计算和统计方法对语言进行操作;GAI最终是通过数学方式预测文字的后续构成,然而它事实上获得了写作、归纳、总结等能力[1]。
根据WCO预测,大部分海关将逐步采用GAI作为其信息(Information Technology,IT)系统的一部分,原因如下[1-2]:1)GAI类型繁多,已经成为政务领域成熟、可用的人工智能(Artificial Intelligence,AI)体系;2)自然语言交互使得界面更加友好、直观,有利于服务更多行政相对人;3)GAI能够根据自然语言提示生成多模态结果,包括文本、图像、音频、视频等;4)该技术正在全社会广泛、快速传播,并持续演进;5)在国际层面,各主要经济体政府正致力于信任AI的现实成果。
海关的IT系统是维护各国国际贸易平稳运行的重要平台,面对GAI新趋势,应采取审慎的引入策略。但是《政策说明》的研究主要借鉴其他行业的实践成果,采取较为笼统的比较分析和定性分析,对于各国海关而言,缺乏科学的量化方法评估场景及执法需求,也难以为后续技术架构决策提供比选依据。
考虑到相对于人工作业,GAI具有较为显著的效率优势,因此海关在选择评估指标时应重点评估其能否提供相对准确、一致的处理结果。此外,由于自然语言表达的多样性,相同的处理结果可以通过不同的语种、风格、文字表达,因此应该重点以GAI反馈的内容实质进行评价。由于本质上GAI也是一种信息加工、转换技术,而信息论体系中信息熵(Information Entropy,IE)主要用于描述概率事件的不确定性[3],因此参考ZHOU等[4]、WEI等[5]地研究,探索应用IE作为量化指标,评估GAI在海关的应用场景和技术架构决策。
2 信息熵模型构建
2.1 “三方”语料库模型
由于AI产业中,大型企业特别是跨国大型企业的影响较大,因此尽管不同的GAI模型功能各有特长,但受到其投资方、二级市场以及第三方模型评测机构算法等因素影响,短期内GAI模型算法的技术路线趋于近似。所以,在通用AI理论和技术短期内无法实现颠覆性突破的假设下,按照目前主流的研究和应用情况,不同GAI模型处理能力的差异更多源于语料库(Corpus)提供的领域知识。为此,假设一个所示的“三方”语料库场景:
1)Ⅰ海关语料库:数据集(Dataset)包括执法依据(法律、法规、双多边条约、规章、规程、标准等)、执法环节使用、产生的关键贸易单证及数据元(Key Trade Documents and Data Elements,KTDDE)[6]、物流路径、运保杂(运费、保费、杂费等)经济数据、缉获案件数据等。
2)Ⅱ国际经贸语料库:数据集覆盖贸易、金融、物流、监管等[7]。
3)Ⅲ通用GAI语料库:主要由大型AI企业、科研机构、院校建设,数据集涉及百业千行。
其中,海关执法环境由于主要为国际贸易领域,因此语料库与交集比例较高;而通用GAI语料库由于涉及行业庞杂,因此与、与的交集比例相对较小,特别是Ⅲ与Ⅰ交集部分比例更小;而、、也存在一定共同交集。3个领域的数量规模、、满足式(1)条件:
(1)
2.2 信息熵模型定义
为了通过信息熵量化概率事件中的不确定性,设定如下[3]:
1)假设随机事件发生概率为,其信息熵函数为,如式(2)所示它是的单调非负减函数,即随着发生概率的增加,确定性更高,信息熵越小,反之亦然。
s.t. (2)
= (3)
2)在随机事件相互独立的情况下,如果多个随机事件同时发生,信息熵具有可加性。假设、为两个独立事件,和同时发生的信息熵函数应满足式(3)和式(4),而式(5)的信息熵函数同时满足式(2)和式(3)的约束,它是理论最优解。
(4)
(5)
3)考虑到包括GAI在内的AI项目相对同样功能点的常规IT项目通常投资更大,因此所有方对于数据集和语料库中的数据清晰、筛选较为严格,而且在迫切的执法(语料库)或市场竞争(语料库、)驱动下,均有充分发掘数据领域知识的动力和行动。为此,假定“三方”语料库的数据质量水平趋于一致,结合前述技术路线趋于近似假设,因此影响、、语料库支持的GAI模型准确率主要基于其语料库规模。
4)随着语料库规模的增加,能够发掘的新知识尽管会继续增加,但增速持续降低,即出现所谓边际收益递减情况,因此假设概率满足式(6)的函数形式,将式(6)代入式(5),可知不同语料库规模下、信息熵差可表示为式(7)所示的函数。
(6)
( 7 )
式(5)根据式(6)以及语料库规模边际收益递减假设,因此如式(7)所示,应是语料库规模比的单调减函数。
2.3 构建分析模型
以《政策说明》为例,假设中各语料库的数据质量均较高,设、、分别为不同场景下相关语料库的信息熵,而和分别表示需求侧对于数据集规模和信息熵要求,结合式(4)和式(6),假设仅采用中单个语料库,可以用信息熵评估GAI在海关各场景的分析结果,具体情况见[1]。
根据式(6),结果中能够符合或大致符合信息熵要求的场景包括基于语料库的场景3、6、7和基于语料库的场景4。如果进一步考虑部分海关业务数据和管理数据的安全保密要求,不适合导出至外部GAI平台计算,因此,目前大致可行的为使用语料库的场景3,即采用专门的国际经贸语料库开展调研分析。同时,尽管使用语料库的通用GAI规模庞大,但因为反馈内容的信息熵较高,表达相对含糊甚至容易造成歧义,因此不适于直接提供给关员和行政相对人使用。
3 GAI技术架构改进设计
3.1 比选技术架构
表1结果显示,仅采用、中单个语料库,目前难于开拓GAI在海关工作的应用场景。为把握GAI技术发展机遇,可以探索组合使用不同语料库,发挥各自优势和不足,改进GAI技术架构。假设海关内部既有AI模型、国际经贸GAI模型和通用GAI模型分别为、、2中列出部分备选技术架构方案,其中黑色线条为数据流向。
考虑到使用语料库Ⅲ建立通用所需的算力和维护投资规模庞大,因2仅为部分选项,且未包括海关自建的选项;根据的、、的使用方式及数据流向组合,还可以设计更多的技术架构选项。相应地2各方案比选结果见表2[1]。
总体而言,在兼顾投资规模和应用场景的前提下,表2中选项ii可以较好地满足海关的GAI应用需求。
图2 GAI技术集成架构选项
Fig.2 Optionsof GAI Technology IntegrationArchitecture
此外,根据信息论,设为信噪比,如果信道容量满足式(8)情况下,理论上存在特定编码,可以确保满足带宽的前提下误差概率趋近于0,即实现精准可用的应用场景[3]。对比i与ii、iii,后两者通过采用更加聚焦海关工作语料库降低了信噪比,因此在海关GAI需求相对稳定的前提下,仅需要较小的算力规模(容量)就能够实现GAI误差率趋近于0,有效辅助关员执法需要。而且方案通过ii将特征标签、参数的计算交给外部GAI环境,将分解为内部算力和外部带宽两部分,而且根据式(1),可知,因此海关仅需较少的算力投资,即可以获得方案iii类似效果,投入产出效果更好。
(8)
3.2 微调措施
此外,考虑到中仍存在一定比例的差集内容,针对集合可以根据式(8)对方案ii、iii进一步微调,通过补充海关法规、技术规范、技术标准及国际条约中的规范性文件等,提高信噪比(),同时结合打标签、扩充特别语料等方式,进一步降低对的需求[1]。
1)打标签:附加无歧义的数据标签,可以实现该部分数据集趋近于,根据式(8)可知,这意味着对相关训练数据所需的趋近于0;通过持续打标签,可以不断提升整体信噪比,降低GAI合作或自建成本。以需要严格监管的氯甲酸仲丁酯为例,相关数据通常属于集合,可以结合风险防控和税收征管需要,建立如下标签示例:氯甲酸仲丁酯 #危化品# #危险品# #1518(危险化学品目录序号)# #17462-58-7(CAS)# ,而且根据监管需要还可以附加更多标签。通过标签关联结果数据,可以为海关IT系统及中场景1至场景6提供关于氯甲酸仲丁酯的准确反馈结果。
2)扩充语料库:对于重要商品, GAI 还可以在、语料库基础上,扩充更为具体的、深入的内容。语料库除了KTDDE、法律法规以外,还可以补充原产地规则、估价规则、税则等,甚至对于缉获金额较大、发展趋势较明显的商品,可以充实海关执法网络(Customs Enforcement Network,CEN)情报等[8],特别是对于表1中场景7、场景8。
3)加强监管语料库合作:随着GAI应用的日趋普遍,可以结合智慧海关建设中业务条线的AI需求,扩充更多行业、地方、语种的语料库。代入式(8)可知,从服务海关执法需要的角度,通过专业语料库合作,可以实现与自建类似的适用效果。例如:通过合作获取商品制作工艺以及光谱、色谱、气味、性状等特征,以及物流调度、装载特征等[9-11]。
3.3 构成生产力
遵循马克思政治经济学理论,按照《政策说明》,在上述微调措施支持下,可以通过在海关IT环境中引入GAI技术、大模型(Large Model,LM)技术、建设专门海关语料库等措施[1,12],实现3所示基于GAI的新型生产力构成。
图3 基于GAI构成新型生产力
Fig.3 The Formation of New Productive Forces based on GAI
1)新型劳动力:掌握数据科学技能的关员。
2)新型劳动对象:主要是当前执法环境下,海关面临的新风险、新问题。
3)新型劳动资料:底座是海关大数据池;然后,可以在智慧海关建设中的业务条线、业务场景中提取典型数据集,构建海关语料库基础内容,并且在微调过程中充实、细化语料库内容;再次,根据自然语言的不同交互需要,搭建面向多模态语料库的各类LM,包括语言大模型(Large Language Model,LLM)、视觉大模型(Large Vision Model,LVM)以及针对监管场所和设施物联网的工业大模型(Large Industry Model,LIM)等[12];最后,通过GAI工具调用各类LM,实现基于自然语言的人机交互,辅助关员执法,甚至替代人力完成部分在线服务。
4 结语
采用信息熵作为GAI量化评估手段,可以根据海关内外的语料库规模,通过式(4)和式(6)有效评估适用场景,不仅能够评估单一语料库方式下不同的应用场景,也能够结合式(8)评估海关与外部开展GAI合作的技术架构方案,分析多语料库组合使用的场景。在此基础上,海关能够以可评估、可度量的方式,构成新型生产力。为实现该目标,根据《政策说明》的建议和表图3的分析结果,建议近期海关应聚焦3个领域:集成外部GAI接口,并在海关IT系统上扩展自然语言人机交互功能;为关员提供训练课程,更好发挥GAI优势,同时降低应用风险;建立海关专用语料库[1-2]。
参考文献
[1] OMD. Note Recherche & Politiques sur l’Intelligence artificielle générative en douane[R]. Bruxelles: Le Secrétariat de l’OMD, 2023.
[2] OMD. Les douanes d’Azerbaïdjan développent un outil IA-SH avancé[J/OL].(2023-11-16)[2024-03-25]. https://www.wcoomd.org/fr/media/newsroom/2023/november/advanced-ai-hs-tool-developed-by-the-azerbaijan-customs.aspx:1-20.
[3]王翔. 海关信息化四十五年发展模式探究——从H761到H2018[J]. 海关与经贸研究, 2021, 42(5): 62-73.
[4] ZHOU C, YOU W, LI J, et al. INFORM: Information eNtropy based multi-step reasoning FOR large language Models: Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, December, 2023[C]. Singapore Association for Computational Linguistics, 2023: 3565-3576.
[5] WEI L, TAN Z, LI C, et al. Large language model evaluation via matrix entropy[J]. ARXiv preprint, 2024: 3568-3569.
[6] ICC. Key Trade Documents and Data Elements Report[R]. Paris: ICC DSI, 2023: 4-5.
[7]王翔. 基于区块链技术服务贸易畅通探讨[J]. 中国口岸科学技术, 2020(3): 4-12.
[8] Juárez Allende HH. Enforcement[M]. The World Customs Organization: Past, Present and Future. Cham; Springer International Publishing. 2022: 151-176.
[9]王翔, 金晶. 基于海关数据模型的铁路跨境运输数据标准研究[J]. 铁道运输与经济, 2023, 45(3): 1-9.
[10] Li T, Cui X, Zhao X, et al. Three-dimensional reconstruction method of rail corrugation based on the vision detection[J]. Tribology Transactions, 2024: 1-36.
[11] Algarni A, Acarer T, Ahmad Z. An Edge Computing-based Preventive Framework with Machine Learning-Integration for Anomaly Detection and Risk Management in Maritime Wireless Communications[J]. IEEE Access, 2024: 1-9.
[12]王翔, 周辉, 李志鹏, 等. 数据稀缺性与大模型数据价值的非对称性[J]. 信息安全研究, 2023, 9(7): 637-642.
基金项目:海关总署科研项目(2019HK018、2020HK281、2020HK300、2022HK053)
第一作者:王翔(1979—),男,汉族,北京人,博士,高级工程师,主要从事海关信息化工作,E-mail: newonemail@163.com
1. 全国海关信息中心 北京 100005
2. 海关国际贸易信息标准化应用创新实验室 北京 100005
1. The National Information Center, General Administration of Customs, Beijing 100005
2. Laboratory of International Trade IT Standards, General Administration of Customs, Beijing 100005
中国口岸科学技术
图1 语料库协同关系
Fig.1 Collaboration between Different Sources of Corpora
表1 信息熵分析单一语料库模式下海关潜在场景
Table 1 Analysis of Single Corpus Pattern for Potential Scenarios in Customs via Information Entropy
编号 | 海关潜在场景 | 供给侧 | 需求侧 | |||||||||||
1 | 对话机器人 | L | L | M | M | VH | H | H | VL | M | VH | M | VH | |
2 | 公共关系 | L | L | H | M | VH | H | VH | VL | H | VH | H | VH | |
3 | 调研分析 | M | M | H | M | VH | M | VH | M | M | H | L/VL | M | |
4 | 协助协作 | H | VL | H | L | H | M | M | VL | L | L | L | L/VL | |
5 | 协助数据分析 | L | M | H | M | VH | M | VH | L | H | VH | H/M | VH | |
6 | 培训助手 | M | VL | M | M | H | M | M | VL | L | M | L/VL | M | |
7 | 收集数字证据 | M | VL | M | M | M | M | VH | VL | L | L | L/VL | M | |
8 | 情报资料融合 | H | M | M | M | M | M | M | M | VL | VL | M | M |
注: VH、H、M、L、VL分别表示很高、高、中、低、很低.
表2 海关GAI合作技术架构对比
Table 2 Comparison of Different Technology Architectures for Customs GAI Collaboration
选项 | 数据流向 | 海关IT系统访问 | 主要优势 | 主要不足 | 主要风险 | 潜在场景 | ||
数据 | 方向 | 内部 | 外部 | |||||
i | 海关数据 | 导出 | A | (含B) | 语料库丰富 | 结果信息熵较高 | 可用性风险 | 3 |
ii | 参数查询 (α) | 导出 | 结合B'特征内容, 对A训练、充实的结果(A' ) | —— | 功能定制灵活 | 结果信息熵较低 | 训练数据集 | 1、2、4、5、6、7、8 |
特征标签、参数( B' ) | 导入 | |||||||
iii | 国际经贸GAI模型B及配套语料库II | 导入 | A、B | —— | 功能定制灵活 | B更新成本较高 | 控制措施兼容性 | 1、2、3、4、5、6、7、8 |