基于AI技术的海关软件自动化测试平台设计与应用-中国口岸科学技术-2026年01期

基于AI技术的海关软件自动化测试平台设计与应用

作者：缪佳辉李珺郭云黄孙杰

缪佳辉李珺郭云黄孙杰

缪佳辉¹ 李珺¹ 郭云¹ 黄孙杰^{1 *}

摘要 软件测试作为信息化建设的关键环节，对保障信息系统的稳定性与安全性具有重要作用。应用自动化与智能化的软件测试技术，有助于应对复杂业务逻辑、高并发处理场景以及快速迭代的开发模式，显著提升测试效率、测试质量与系统迭代速度。本研究以深圳海关自动化测试平台建设为实践背景，深入探讨了将人工智能大模型技术融入自动化测试体系的理论框架、实现路径与应用价值。该融合模式可有效提升测试工作的智能化水平，保障信息系统在持续演进过程中的质量稳定性，为海关信息化建设提供技术支撑。

关键词 人工智能技术；人工智能大模型；自动化测试

Design and Implementation of an AI-Powered Automated Testing Platform for Customs Software

MIAO Jia-Hui¹ LI Jun¹ GUO Yun¹ HUANG Sun-Jie^1*

Abstract As a key link of information construction, software testing plays an important role in ensuring the stability and security of information systems. The application of automated and intelligent software testing technology helps address complex business logic, high concurrent processing scenarios and rapid iterative development mode, and significantly improves test efficiency, test quality and system iteration speed. Taking the construction of Shenzhen Customs Automated Testing Platform as our empirical setting, this study systematically elaborates the theoretical framework, implementation pathway, and application value of embedding artificial intelligence large models within an automated testing regime. The proposed fusion paradigm elevates the intelligence level of testing activities, ensures quality stability during continuous system evolution, and provide technical support for the high-quality development of customs informatization.

Keywords artificial intelligence technology; AI large models; automated testing

海关信息化系统承载着进出口贸易通关、征税、监管、统计等核心职能，海关业务又呈现监管规则多、系统模块多、数据交互多、政策迭代快等特征。系统复杂度不断提升，对软件测试提出挑战。传统的软件开发测试模式主要依赖人工进行用例设计、测试执行与结果验证。在当前系统快速迭代与高质量交付的要求下，该模式在持续反馈效率、测试覆盖面与长期稳定性方面仍有提升空间，亟待向更自动化、智能化的测试体系演进。因此，构建一个高效、智能、可靠的自动化测试体系，已成为海关信息化建设的迫切需求。

1 现状分析

1.1 海关信息化系统特点

新一代海关信息系统呈现出“云、网、端”一体化的技术架构特点，其松耦合、微服务化的设计使得接口测试和集成测试的复杂性显著增加。现有研究针对海关业务规则动态性强的特点，提出了基于规则引擎的测试数据生成方法，但在实现政策文本到可执行代码的自动转化方面仍有待提高。高并发、多节点协同的跨境电商通关等场景，也对现有性能测试工具提出了新的挑战。海关信息化系统特点主要包括：（1）业务复杂性高：业务层面规则复杂、流程状态多；（2）系统集成度高：需通过多样化接口协议与港务、机场、银行及税务等外部系统实现数据交换；（3）数据安全要求高：涉及敏感信息，且日处理数据量庞大；（4）高并发与高性能要求：在业务高峰时段需承受瞬间巨大的申报与查询压力；（5）国产化环境适配：需适配国产化基础软硬件环境，包括国产操作系统与数据库。

1.2 自动化测试技术的发展

软件测试是使用人工或自动的手段来运行或测定某个软件系统的过程，其目的在于检验系统是否满足规定的需求或测试预期结果与实际结果之间的差别。传统测试方法多依赖人工或简单规则生成工具，基于静态分析或有限算法，在面对复杂代码时难以全面覆盖功能与缺陷，涉及系统多环节交互时在模拟多操作路径，跨设备、网络等动态环境方面存在短板，影响兼容性与可靠性验证。

自动化测试相较于传统测试方法，其核心优势在于能够将测试活动从高度依赖人力的重复劳动，升级为高效、精准且可持续的工程化流程。自动化测试的优势集中体现在三大发展方向上：（1）智能化，即在测试过程中引入了感知环境、人机交互、逻辑推理与自主学习的智能化特征；（2）网络化，通过运用现代网络与信息技术，实现了测试数据的实时采集、传输与协同分析；（3）综合化，表现为测试功能日益多元、系统日趋集成，能够满足复杂场景下的多样化验证需求。从演进历程来看，自动化测试技术已从早期单一的功能验证，逐步发展为综合化、系统化、平台化的现代测试体系。这一过程大致经历了几个关键阶段：从使用简易仪器进行基础测试，到构建复杂的自动化检测系统，再到融合图像识别、语音分析等AI能力的智能测试阶段。

近年来，自动化测试技术已从早期的脚本录制回放，演进为支持全协议、分布式压测与持续集成的综合平台，取得了长足发展。同时，AI技术特别是大语言模型（Large Language Models，LLMs）和多模态模型在自然语言处理、图像识别和代码生成等领域取得了突破性进展，以生成式预训练Transformer（Generative Pre-trained Transformer，GPT）为代表的AI大模型技术在代码生成、自然语言理解、模式识别等领域展现出强大能力。自动化测试技术对辅助AI编码具有重要支撑意义，为AI生成的代码构建了快速验证防线，能有效识别并拦截语法错误、逻辑缺陷与安全风险，是应对模型“幻觉”导致代码不可靠问题的关键技术手段。在此趋势下，将AI大模型与自动化测试深度融合，有望推动测试工作从“自动化”全面迈向“智能化”，实现测试用例智能生成、流程自主优化、缺陷根因分析及报告自动生成。

聚焦于测试用例生成这一关键环节，基于AI的生成方法已成为重要发展趋势。研究表明，基于深度学习的测试用例自动生成已形成从数据驱动到语义理解的技术演进路径。具体到UI测试生成，其核心挑战在于对页面元素的精准理解与定位，融合视觉与DOM信息的元素定位方法为解决多模态融合问题提供了有效思路。这些研究成果连同大模型所展现的通用能力，共同为其构建AI驱动的、融合多模态信息的智能测试生成方案奠定理论基础。

2 自动化测试平台技术方案

2.1 总体架构

本方案基于深圳海关建设的一站式自动化测试平台，采用前后端分离架构，前端使用React.js构建交互式管理界面；后端依据场景精准选型，高并发核心服务以Golang实现，确保微秒级响应；复杂业务逻辑采用Python，提升开发效率。在微服务化的核心业务层，系统拆分为管理服务、项目管理、权限服务等多个独立模块，通过RESTful API与WebSocket提供标准化与实时性的服务接口，实现了业务的高内聚、低耦合与独立部署伸缩。为进一步支撑自动化测试等高负载任务，该系统设计了engine分布式执行引擎层，将接口压测引擎与UI自动化引擎分离，两者均可根据任务量动态调度资源，实现弹性伸缩。所有数据由统一存储与处理平台支持：达梦存储核心关系数据，Redis提供高速缓存，MongoDB处理非结构化文档，Kafka管理实时消息流，并通过独立的Collector服务进行全链路性能数据的采集与聚合，从而构建了一个层次清晰、各司其职、能够灵活响应业务变化与技术挑战的现代化应用架构体系。

如图1所示，自动化测试平台采用分布式系统架构，核心是一个通过管理平台进行调度的自动化测试系统。

2.2 技术设计

2.2.1 技术选型

为达成高性能、高智能与高适应性的目标，平台在技术选型上进行了针对性设计。后端采用Golang + Python双语言策略：Golang 凭借高并发与近似C语言的执行效率，承载核心服务与高性能测试引擎；Python则依托其丰富的AI与自动化生态，基于 Python + Playwright 实现自动化测试框架，快速集成机器学习模型并支持UI自动化脚本高效开发。为应对频繁变化的业务规则，选用Drools作为规则引擎，允许业务人员以近自然语言的语法定义与维护规则，提升对政策法规的响应速度与合规适应能力。流量接入与消息枢纽由中间件层承担，通过Nginx集群实现负载均衡，Kafka集群保障异步通信。核心业务逻辑由业务层引擎集群支撑，包括实时计算引擎（rg-engine）、流处理引擎（frg-engine）和规则引擎（rfg-engine），并由统一管理模块（rg-management）进行集中管控与调度。数据持久化层选用国产化数据库作为主存储，并辅以Redis集群实现高速缓存，同时使用MongoDB集群处理非结构化数据。在执行引擎层面，基于成熟的开源测试平台引擎进行深度增强，快速获得了分布式调度、实时监控与压测能力，在保证稳定性的同时降低了自研成本与风险。

2.2.2 部署环境

本项目构建了符合政务系统安全合规要求的全栈国产化技术体系。系统采用分层架构设计，以实现高可用与可扩展的部署环境。前端层通过PC端管理控制台与Web可视化界面为用户提供交互入口，部署于管理网的前端接入区，保障访问安全与可控。在基础环境层面，服务器采用国产化操作系统，数据存储层全面适配国产数据库；应用访问层支持国产化浏览器，满足自主可控要求，同时兼顾了系统使用的灵活性与广泛兼容性。该架构通过层次化隔离与专业化组件部署，在确保系统性能与扩展性的同时，通过容器化部署与微服务架构，实现资源弹性分配与系统高可用保障。

2.2.3 运维能力

本系统构建了涵盖资源隔离、稳定性保障与统一管控的智能运维体系。基于Kubernetes实现容器化部署，严格隔离CPU、内存及网络资源，并通过管控模块为不同项目划分独立资源池。通过Nginx加权轮询与Kafka分区策略保障核心业务优先级，引擎层具备实时健康监测与故障自愈能力，异常节点自动隔离，同时建立预警机制，对Redis内存碎片率、MongoDB慢查询等关键指标进行主动监控。在多项目管控维度，提供统一监控看板，实时展示各项目的CPU、内存及存储资源占用率，并支持跨引擎性能数据的聚合分析，实现全栈资源的可视化与精细化运维管理。

2.2.4 安全设计

在安全体系设计上，平台严格遵循国家信息安全等级保护三级要求构建整体架构，实现全方位、多层次的安全防护。数据安全层面，通过对测试数据执行全流程脱敏处理、采用国密算法进行加密存储与传输，实施全链路HTTPS通信，确保敏感信息在采集、传输与存储各环节的安全可控。在操作审计方面，平台建立了涵盖操作日志、系统日志、安全日志与审计日志的四维立体化日志体系，引入动态水印与操作溯源功能，实现对任何用户行为的全程留痕与精准追溯，满足政务系统对安全合规性与操作可审计性的要求标准。

2.3 核心功能模块

2.3.1 数据大屏

数据大屏可综合查看自动化测试平台各个领域的关键指标，不用分别查看不同的模块即可全面了解整个项目的测试和管理情况，快速评估进展和质量，及时发现潜在的问题和风险。为项目测试人员提供全面的数据支持，减少了信息收集和整理的工作量，从而更加专注于项目的成功和质量提升。

2.3.2 API测试

本系统构建了测试对象与场景、性能及自动化测试间的双向数据同步机制，实现测试数据流转。在场景管理层面，提供可视化拖拽的接口流程编排能力，支持条件、循环控制及参数化配置，以灵活构建复杂业务场景。性能测试支持从场景一键导入，提供并发模式、阶梯模式等多种压测模式，具备多模式压测、分布式压力发起、实时监控与多维度报告分析能力，可实现数万甚至十万级的并发用户模拟压力测试。同时，集成可视化mock服务模拟接口响应以保障测试前置性。通过高度集成的数据交互、场景编排与验证能力，提升了接口测试的效率、覆盖深度与可维护性。

2.3.3 UI自动化

平台通过模拟用户操作来验证应用程序界面功能的一种方法，有助于提升软件质量与用户体验。可通过拖拽配置快速搭建自动化流程的系统，其核心包括元素管理（实现UI元素的集中复用与维护）、场景管理（通过步骤配置灵活构建各类测试场景）以及计划管理（支持场景组合、定时执行并生成详细测试报告），以协助开发人员高效发现和解决界面问题。通过页面调用API接口进行操作，满足更全面的测试场景需求，如通过open-api接口对接安全扫描工具对代码进行安全性测试。

2.3.4 项目管理

平台帮助开发团队更好地组织和协调项目工作，提高工作效率和团队协作能力。涵盖了需求管理、迭代管理、任务管理、测试计划、测试用例管理、缺陷管理等方面。通过项目管理，项目团队成员可以更好地跟踪任务、处理缺陷、管理文档，并进行有效的沟通和协作，以此保障项目有序推进、风险可控并最终成功发布。

3 AI技术在自动化测试的应用研究

该自动化测试平台基于微服务、全栈国产化与智能运维，提供了稳定的自动化测试能力。但面对海关业务的高度复杂与动态变化，如何进一步为平台赋予感知、思考与决策的“智慧”，实现从“被动执行”到“主动适应”的跨越将是下一步重点研究的对象。

近年来，以GPT、LLaMA、DeepSeek等为代表的LLM展现出了强大的自然语言理解、代码生成和逻辑推理能力，为软件测试领域的智能化转型提供了新的技术路径。特别是多模态大模型的出现，使得AI能够同时理解文本、图像等多种信息，为UI自动化测试的智能生成提供了可能。本研究探索AI人工智能技术与自动化测试平台深入融合，重点引入多模态大模型与自然语言处理技术。主要聚焦于两大关键应用：一是利用AI智能生成UI测试步骤、断言与场景，变革用例编写方式；二是通过AI自动分析海量性能数据，生成深度洞察报告。

3.1 AI智能生成UI测试步骤、断言与场景

基于用户操作录像和页面截图，利用AI技术自动生成包含测试步骤、元素定位策略、输入数据和断言逻辑的完整UI测试场景。系统通过多模态大模型解析用户操作路径与界面控件语义，结合历史用例库的相似场景模式匹配，自动生成高覆盖率测试脚本；为实现对用户操作的精准“感知”，系统构建了细粒度的多模态数据采集管线。通过浏览器扩展，实时捕获操作序列（点击、输入等行为及其时间戳、目标元素）、页面快照（关键步骤的全屏截图与序列化DOM树）以及上下文语义信息（URL、元素ARIA属性等）。采集的原始数据经过预处理：DOM树被简化为语义结构，截图通过视觉增强突出交互元素，并运用Sentence-BERT、ViT等模型提取文本、视觉及结构的深度特征，为后续的AI理解提供融合了视觉、文本与结构信息的统一数据基础。

基于大模型的场景理解与意图识别，核心是利用多模态大语言模型（如DeepSeek-V3）进行分阶段的深度场景理解。通过精心设计的提示工程，引导模型扮演测试专家角色，分析操作序列与页面快照，从而完成从具体操作到抽象业务流程的跃迁。这一过程将原始数据提升为富含语义的、可解释的测试场景描述，为后续的代码生成奠定了认知基础。

在生成可执行测试步骤时，系统采用创新的混合生成策略。对于元素定位，系统将多种候选定位器（ID、文本、XPath等）交由LLM，依据唯一性、稳定性和可读性标准进行智能评估与优选，模拟专家决策，确保生成脚本的长期健壮性。对于断言生成，则采用“规则引擎+LLM推理”的混合模式，常见模式由规则模板覆盖，复杂业务逻辑验证则由LLM分析上下文后，智能推断出多个隐含的、业务相关的断言点，从而确保测试的深度与有效性。

该方案不仅是一个算法模型，更是一个可工程化部署的完整系统。它能将AI生成的结构化测试场景无缝转换为适配自动化测试框架（如Playwright）的脚本并执行。更重要的是，系统设计具备闭环进化能力：测试执行结果与人工修正反馈可回流至系统，用于持续优化提示模板或微调模型，使其在实践中越用越智能。基于AI视觉理解的UI自动化测试，将从“工具辅助脚本驱动”迈入“AI视觉驱动”的下一代实践，通过AI赋予测试平台“感知—认知—生成”的智能，实现测试资产高质量、高效率的自动创造与持续优化。

3.2 AI智能分析和生成测试报告

利用AI技术对性能测试产生的海量指标数据进行智能分析，自动识别性能瓶颈、生成根因分析报告，并提供优化建议。性能测试结果智能分析模块基于DeepSeek API构建根因推理引擎，对监控指标异常波动、资源瓶颈及错误日志进行关联分析，输出结构化诊断建议。系统通过时序异常检测算法识别指标波动模式，结合调用链拓扑关系与日志语义解析，构建多维度关联图谱，利用DeepSeek大模型进行根因推理，精准定位数据库慢查询、缓存击穿或线程阻塞等问题的根源，并生成可读性强的自然语言分析报告，辅助测试人员快速决策。

首先，在数据预处理层，对Collector汇聚的原始流数据进行秒级聚合、降采样与对齐，并系统性提取统计特征、时序趋势及基于CUSUM/PELT算法的突变点特征，将非结构化数据转化为可用于深度分析的特征向量。其次，在异常检测层，采用规则阈值、统计模型（如Isolation Forest）与深度学习相结合的多层级检测策略，自动识别从指标异常到系统瓶颈的各类问题。最终，在智能分析层，引入基于LLM的报告生成管道，通过精心设计的多阶段Prompt工程，引导模型逐步完成从数据摘要、异常分析、根因追溯到优化建议生成的深度推理；并借助检索增强生成技术，检索历史案例库与最佳实践，为分析注入经验知识，最终自动生成结构清晰、含有关键指标评估、根因定位及可行优化建议的深度分析报告，将性能洞察的产出从小时级缩短至分钟级，改变了性能测试的分析模式。

4 结论

本研究基于AI大模型的软件自动化测试技术，通过融合多模态大模型、分布式架构与国产化生态，实现了测试用例的智能生成、执行调度的精准高效与测试分析的自动化决策。该体系不仅能将UI脚本编写与性能根因分析效率提升数倍，更能深度适应海关业务规则多、系统集成度高、安全要求严格的特殊需求，为海关信息化建设提供技术支撑。

参考文献

[1]刘芳, 陈刚. 新一代海关信息系统架构研究与实践[J]. 海关与经贸研究, 2022, 43(4): 88-95.

[2]王磊. 基于业务规则的海关测试数据生成方法研究[D]. 天津: 天津大学, 2021.

[3]高瑞峰. 海南自贸港海关智慧监管压力测试策略研究[J]. 中国口岸科学技术, 2023, 5: 33-38.

[4]杨晓庆. 软件测试技术现状与发展趋势研究[J]. 电脑编程技巧与维护2020(4): 62-63

[5]王磊. 人工智能技术在软件自动化测试的应用研究[J]. 信息与电脑(理论版), 2022, 34(8): 174-176.

[6] Brown TB, Mann B, Ryder N, et al. Language Models are Few-Shot Learners[J]. Advances in Neural Information Processing Systems, 2020, 33: 1877-1901.

[7]刘知远, 崔磊, 孙茂松. 大语言模型：原理与进展[J]. 中国科学: 信息科学, 2023, 53(1): 1-21.

[8]程志波.人工智能驱动的自动化测试工具研究[J]. 信息与电脑, 2025, 37(2): 28-30.

[9]查海波, 刘伟, 张莉. 基于深度学习的测试用例自动生成方法综述[J]. 软件学报, 2022, 33(5): 1523-1545.

[10]刘振宇, 蔡立志, 陈昊鹏. 融合视觉与DOM信息的Web页面元素智能定位方法[J]. 计算机研究与发展, 2023, 60(8): 1785-1802.

基金项目：海关总署科研项目（2025HK180，2025HK186，2025HK192）

第一作者：缪佳辉（1985—），男，汉族，湖南浏阳人，本科，高级工程师，主要从事海关信息化工作，E-mail: 77261502@qq.com

通信作者：黄孙杰（1987—），男，汉族，广东湛江人，本科，高级工程师，主要从事海关信息化工作，E-mail: 199619162@qq.com

1. 深圳海关信息中心深圳 518045

1. Shenzhen Customs Information Center, Shenzhen 518045