CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
大模型技术在智慧海关建设中的应用探索与研究
作者:黄孙杰 吴志刚 李萱 张慧昕 包先雨 吴佳明
黄孙杰 吴志刚 李萱 张慧昕 包先雨 吴佳明
黄孙杰 1 吴志刚 1 李 萱 1 张慧昕 1 * 包先雨 1 吴佳明 2
摘 要 在当前口岸贸易形势复杂、监管难度大的背景下,本文提出利用大模型(Large-model)技术赋能监管效能提升,对大模型技术的内涵、发展历程、国内外相关工作进展进行介绍,讨论了海关系统应用智能化技术的实践探索,分析了使用大模型技术对海关工作的积极意义,同时从管理、算力、安全、治理和应用五个维度,对海关建设大模型提出相关建议,可为智慧海关建设提供有益参考。
关键词 海关大模型;智慧海关;大模型安全;算力
Exploration and Research on the Application of Large- Model Technology in Smart Customs Construction
HUANG Sun-Jie 1 WU Zhi-Gang 1 LI Xuan 1 ZHANG Hui-Xin 1* BAO Xian-Yu 1 WU Jia-Ming 2
Abstract Against the backdrop of increasingly complex international trade patterns and growing challenges in port supervision, this study proposes a large-model (LM)-enabled solution to enhance customs regulatory efficiency through technological empowerment. It examines the conceptual framework, evolutionary trajectory, and recent advancements of LM technology in both domestic and international contexts. It further explores practical applications of intelligent technologies within customs systems and evaluates the strategic significance of LM adoption for customs operation, and offers recommendations for the development of LM technology in customs from the five perspectives of management, computing power, security, governance, and application. These suggestions can provide valuable insights for the construction of Smart Customs.
Keywords customs large-model; Smart Customs; large-model security; computing power
我国口岸类型众多、业务繁杂,为进一步满足监管需求,亟需采取新技术以提高监管水平。近年来,大模型(Large-model)技术快速发展,作为人工智能(AI)领域的重要突破,大模型能够处理海量多模态数据,整合分析数据、标准、规则、知识等新型生产要素,为智慧海关建设提供了新的技术支撑,也为激发外贸活力、推动经济高质量发展提供了核心驱动力。
1 国内外大模型研究概况
大模型是指预先在海量数据上进行大规模预训练,通过指令微调以适应一系列下游任务的通用人工智能模型,具有强大的性能和接近人类思维的涌现能力[1]。大模型由早期的单语言预训练模型发展至多语言预训练模型,再到现阶段的多模态预训练模型,具有面向多任务的通用问题求解能力,可完成自动识别、精准预测和生成内容等复杂任务[2]。
2018年,OpenAI公司发布了最早一代生成式预训练模型GPT-1(Generative Pre-trained Transformer),并逐渐展现出强大的自然语言理解生成能力,引起了各行业的广泛关注;2024年又发布视频生成大模型Sora,将大模型的多模态生成能力提升至新的高度。
近年来,我国大模型技术发展迅速,截至2025年3月31日,已有346款生成式人工智能服务在国家互联网信息办公室完成备案,涵盖了文字、图像、音频、视频处理等领域[3-4]。部分大模型在处理中文任务能力上已达到或超过GPT-4的水平,初步应用于金融、法律、教育、医疗等专业领域。自2024年底至今,DeepSeek先后发布通用模型V3以及推理模型R1,凭借其低廉的训练部署成本、创新性的深度思考能力等迅速崛起,在全球AI市场中占据一席之地。
2 海关大模型的应用探索
2.1 发展海关大模型的意义
(1)推动传统生产力跃迁,打造营商环境高地。海关大模型作为政务领域的行业大模型,可注入数据、算力等新型生产要素,深度挖掘海关业务关联规则,形成以数据为核心,以高科技、高效能、高质量为特征的新质生产力[5],分析提取隐藏在数据中的有价值信息和规律,为海关提供数据支持和建议,为营造国际一流的口岸营商环境、促进国际贸易合作注入新动能,达到更大范围、更宽领域、更深层次的对外开放水平。
(2)打造海关“智慧大脑”,助推智能化升级。利用大模型生成能力,提供高效建模服务,通过训练加微调的方式,批量生成智能甄选、处置、检查、服务等特色功能模块[6],降低建模门槛,提高建模速度,推动海关数字化转型、智能化升级,是建设海关“智慧大脑”的技术底座。
(3)激发外贸活力,促进经济高质量发展。将大模型对接各类外贸企业仓储管理系统(Warehouse Management System,WMS)、企业资源计划(Enterprise Resource Planning,ERP)等平台数据,有助于实施精准稽查、征税、统计等业务,推动对外贸易现代化,发挥以数据为新型生产要素的“催化”作用,激发外贸新活力,为传统贸易模式升级、促进经济高质量发展提供有力支持,服务国家外贸大局。
2.2 海关智能化建设的探索
近年来,海关总署加快推进智慧海关建设,取得了丰硕成果。针对生物安全风险,研发智能审图模型,利用机器自动识别提高查获率[7];建设海关大数据通用分析平台(云擎),开展数据可视化建模分析,为海关分析研判、风险防控、案件查办提供数据支撑[8]。2024年,智慧海关建设进入全面实施阶段,重点建设九大标志性工程,以数字化转型、智能化升级为核心,推进海关监管理念升级,构建网络化互联、智能化分析、自动化作业的海关监管服务新形态[9]。
在各直属海关层面,广州海关利用光学字符识别(OCR)技术和AI技术,探索应用“智慧审证”,将报关单审核作业时间压缩了80%[10];天津海关打造“水运口岸集装箱智慧货管场景链”,融合深度学习、计算机视觉、自然语言处理等人工智能技术,实现智能感知、智能研判、智能处置[11]。此外,DeepSeek-R1发布以来,深圳海关试点组织建设垂直领域大模型,开展“保税监管要素智能分析预警”应用探索,实现了进出口态势问答、加贸异常预警以及报告自动化生成等功能;本地化部署DeepSeek大模型在旅检、行邮监管等业务场景为现场关员提供实时、专业的业务知识辅助。与基于机器学习技术的小模型应用相比,大模型对于复杂场景适应性更强、知识整合效率更高、主动决策能力更优,在海关业务场景下具有很高的探索应用价值。
2.3 建设海关大模型面临的挑战
建设海关大模型是推进智慧海关建设的重要探索,但在技术研发与落地应用中还面临多方面挑战。例如,模型安全方面,目前大模型还存在因数据输入的微小改动导致可能出现“幻觉”,即输出错误预测或欺骗性信息的现象,在一定程度上会对使用者的决策产生影响[10]。同时,由于大模型新技术的飞速发展,管理应用经验还有待积累,相关建设、运行、维护制度还有待完善。此外,算力基础、数据治理、应用场景等都是海关应用大模型技术可以进一步深化的方面[11]。
3 建设海关大模型的建议
3.1 加强制度建设
建立健全大模型建设管理体系。笔者建议针对大模型的特点、规模、应用场景制定大模型管理制度,明确管理目标、原则、范围和方法,为大模型建设、应用和管理提供指导[12];完善现有项目开发规程,从立项、开发、运维、应用、安全等方面制定基于大模型的全流程规范,保障高质量高标准建设。另外,合理规划大模型开发路径,可结合时效、成本、可行性等多个方面的因素,打造两级大模型开发路径,一是由海关总署牵头开发全国海关大模型,推广到各直属海关应用,直属海关根据应用场景进行参数微调,以适应不同关区的业务特点;二是鼓励直属海关针对自身特色业务开发训练大模型,在实际使用中不断进行指令微调,完善大模型应用成效,形成既符合海关总署统一部署要求,又适用于各地特色业务的全国大模型体系架构。
3.2 深化算力设施建设
加强和科研机构、高等院校等合作,借助已建成的先进算力设施训练海关大模型,并统筹建设署级算力中心,全国海关共享算力资源,进一步科学分配海关算力,提升运行质效。另外,引进和借鉴国际先进经验和技术,提高海关技术研发投入,推进国产计算芯片规模化应用和技术迭代,加快信创算力与应用适配,提升海关大模型效能。
3.3 强化大模型安全保障
(1)采取多种数据安全防范手段。对于在外部训练所需的海关数据,要利用数据脱敏等技术进行处理,防止数据泄露;优化设置大模型访问权限,通过身份验证、权限审核和访问日志记录等措施对用户的访问行为进行跟踪和监控;定期备份数据,预防数据丢失、损坏;制定数据恢复计划,确保大模型发生安全事件后迅速恢复数据。
(2)创新大模型防护技术。建议可与相关企业开展合作交流,开发针对海关大模型攻击的安全技术手段,例如差分隐私、动态密码学、可信执行环境、安全沙箱等[13];利用监管沙盒管理机制,通过数据加密、数据脱敏、云桌面操作技术,实现数据的“可用、可见、不可得”。
(3)破解大模型“幻觉”难题。通过收集并清洗企业申报、现场查验、实验室检测等事实数据,创建低噪声、无干扰的海关业务数据集,以业务数据驱动完善模型架构,消除可能导致错误预测的偏见[13];使用外部统计、互联网舆情等数据主动检测、验证多个输出并检查其一致性,避免产生欺骗性策略等“幻觉”现象。
3.4 完善数据治理手段
(1)采用多种数据处理技术,将多样化、多模态的训练数据进行标注、清洗、去重、过滤、加工和验证等措施处理,提升数据的整体质量,更好地释放数据的价值,提高大模型训练的效果和准确性[14]。
(2)加强海关科技、业务部门以及基层联动协同机制,统筹科技专家、业务专家、社会研发、基层关员各方力量,共同制定数据统一采集、处理和使用标准,打造数据互通的环境,确保大模型数据的统一性、可用性。
(3)利用大模型算力赋能数据质量管理,将大量多源多模态数据整合为统一的数据视图,修正数据不一致、缺失值等错误,再将这些数据注入大模型,优化训练大模型性能,形成业务闭环,驱动大模型的数据处理能力不断迭代升级。
3.5 深化大模型应用创新
(1)积极推广大模型应用。提高科创奖励力度,激励海关各部门主动学习大模型技术带来的技术革新,建立大模型思维,驱动海关各业务领域的智能化和自动化处理;构建科创容错机制,鼓励海关各部门勇于创新,不断完善大模型技术,探索合理应用方法;提供多元场景应用推动迭代更新,结合各关大模型应用平台的探索,在实际业务中开展智能布控、智能监管、智能研判、智能执法等应用,通过应用落地发现新问题、催生新需求,推动大模型创新迭代。
(2)强化技术支撑能力。需要加大经费保障力度,提高技术和算力研发投入,促进海关大模型在性能、效率、应用等方面持续升级;借助科技公司、技术专家等外部力量,组织开展大模型技术培训,着力培养一批既懂海关业务、又懂模型开发应用的复合型专业技术人才,增强梯队储备,健全人才奖励机制和容错机制,打造海关大模型技术团队,提升海关大模型的创新和应用水平。
(3)针对大模型功能特点,打造具有海关特色的大模型应用方案。利用大模型分析生成能力,推送业务所需的政策文件、信息、数据、图表,多元多渠道输出模型运算结果,自动形成分析报告;依托大模型判别能力,搭建智能甄别模式,替代或辅助海关执法过程中发现各类异常情况的人工处理,如智能辨解查询与比对食品标签、在卡口环节自动比对企业申报数据和运输车辆数据等,形成精准布控规则,提高监管效能;发挥大模型预测能力,采用风险和信用管理的规则或算法,对侵权货物等高风险要素智能绘制风险“数据画像”,在海关监管中实现监测执行过程、异常情事预警、检查结论生成,助力风险态势研判,形成一站式、个性化的综合业务服务平台,提高海关工作质效。
4 结语
本文通过分析大模型的技术特性、研究进展与面临的挑战,论证了大模型技术在海关业务领域的应用价值,提出了海关应用大模型的建议。未来,通过持续优化模型架构、强化安全保障、培育复合型人才、推动海关业务的深度应用,大模型技术将加速海关的智慧化转型,为打造安全高效的口岸营商环境、服务国家高水平对外开放提供坚实支撑。
参考文献
[1]刘学博, 户保田, 陈科海, 等. 大模型关键技术与未来发展方向——从 ChatGPT 谈起[J]. 中国科学基金杂志, 2023, 37 (5): 758-776.
[2]高自友, 郭雷. 大数据与人工智能时代下复杂系统管理研究的若干关键科学问题[J]. 中 国科学基金杂志, 2023, 37 (3): 429-438.
[3]郭先会, 张梦姣, 马军. 基于大语言模型的智能体构建综述[J]. 通信技术, 2024, 57(9): 873-879.
[4]张浩严, 吕文涛, 余润泽, 等. 大语言模型研究现状[J]. 无线电工程, 2025, 55(1): 163-174.
[5]王娜, 赵根漩. 大模型技术赋能新质生产力发展:理论逻辑与实现路径[J]. 经济纵横, 2025(1): 100-109.
[6]刘威辰, 杨华锋, 江民民, 等. 大模型应用服务平台建设研究[J]. 信息通信技术与政策, 2024, 50(12): 21-30.
[7]王琪, 陶强. 让大数据创造大价值[N]. 中国国门时报, 2023-07-19(002).
[8]刘雨菲. 让“云擎”跑起来[N]. 中国国门时报, 2023-07-28(001).
[9]李婧靖, 李诚. 以海关之智,服务助推中国式现代化[N]. 中国国门时报, 2025-02-12(004).
[10]张辉, 曾雄, 刘鹏. 中国式治理现代化视域下的人工智能治理[J]. 中国科学基金杂志, 2023, 37(4): 632-639.
[11]关悦, 陈瑜. 广州海关:以“三智”理念激活发展新动能[N]. 科技日报, 2023-12-29(002).
[12]周辉. 大模型安全风险、防护治理与法治建设[J]. 中国信息安全, 2024(6): 18-20.
[13]刘静, 郭龙腾. GPT-4对多模态大模型在多模态理解、生成、交互上的启发[J]. 中国科学基金杂志, 2023, 37(5): 793-802.
[14]安小米, 龙志奇, 邝苗苗. 标准化视角下大模型数据治理的理论框架及其构成要素研究[J]. 情报资料工作, 2024, 45(6): 75-83.
基金项目:海关总署科研项目(2024HK240,2023HK106)
第一作者:黄孙杰(1987—),男,汉族,本科,高级工程师,主要从事海关信息化工作,E-mail: 199619162@qq.com
通信作者:张慧昕(1999—),男,汉族,本科,主要从事海关信息化工作,E-mail: 1595445302@qq.com
1. 深圳海关信息中心 深圳 518000
2. 河南科技大学 洛阳 471000
1. Shenzhen Customs Information Center, Shenzhen 518000
2. Henan University of Science and Technology, Luoyang 471000