CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
智能客服在海关服务热线中的应用研究
作者:原玉芬 安静 唐文治 刘欢 赵亮 周勇 孙培
原玉芬 安静 唐文治 刘欢 赵亮 周勇 孙培
原玉芬 1 安 静 1 * 唐文治 1 刘 欢 1 赵 亮 1 周 勇 1 孙 培 1
摘 要 随着自然语言处理、智能问答等智能交互技术的日益成熟,海关积极探索其在12360服务热线工作场景中的应用。本文结合海关12360热线智慧辅助系统的建设与实践,阐述了智能客服所涉及的自然语言处理、知识图谱等关键技术,重点分析了该系统的业务模式、总体架构、功能设计、知识训练过程以及实际应用效果,可提升坐席服务质效,为推进海关热线服务向智能化转型提供参考。
关键词 智能客服;业务模式;知识训练
Research on the Application of Intelligent Customer Service in Customs Service Hotline
YUAN Yu-Fen1 AN Jing1* TANG Wen-Zhi1 LIU Huan1
ZHAO Liang1 ZHOU Yong1 SUN Pei1
Abstract With the increasing maturity of intelligent interaction technologies such as natural language processing and intelligent Q&A, China Customs have actively explored their application in the working scenario of the 12360 service hotline. This paper, combining the construction and practice of the 12360 Hotline Smart Assistance System, elaborates on key technologies involved in intelligent customer service, including natural language processing and knowledge graphs. It focuses on analyzing the system’s operation model, overall architecture, functional design, knowledge training process, and practical application effects. The research can enhance the quality and efficiency of agent services, providing a reference for advancing the intelligent transformation of customs hotline services.
Keywords intelligent customer service; operation model; knowledge training
全国海关12360服务热线在持续发展中已成为海关服务的重要窗口。随着海关业务改革不断深化,热线知识库体系日益庞大且更新频繁。为此,本研究基于自然语言处理、知识图谱等技术,构建了海关12360热线智慧辅助系统,旨在实现用户问题的快速响应,减轻人工服务压力,提升工作效率,并通过对话务数据的统计分析,为优化海关热线服务提供技术支撑。
1 智能客服关键技术与应用介绍
智能客服是利用人工智能技术模拟人类客服与用户进行自然语言交互,以提供自动化服务的高效系统。它通过自然语言处理、知识图谱、数据挖掘等技术,实现对用户问题的自动理解、智能回答。
坐席人员在接听咨询电话的同时,智能客服系统将实时转写坐席人员与客户对话的内容,并实时分析客户正在咨询的问题,以识别用户意图,系统随后从知识库筛检出相关答案,并展示在坐席人员的操作界面上。
智能客服业务模式示意图如图1所示。在客服人员与用户通话过程中,智能客服系统利用自然语言处理技术,首先通过语音收集识别模块完成语音内容的采集与识别(即让机器记录下来说了什么);再通过内容语义解析理解模块完成对识别后语音内容的理解(即让机器获悉语音内容的意思);随后是通过热线提问归纳筛选模块最终形成具体的问题(即让机器概括提炼出具体问题)。在形成具体咨询内容后,系统就可以通过知识内容库检索出事先归纳整理好的参考答案呈现给用户[1-3]。

图1 智能客服业务模式示意图
Fig.1 Schematic diagram of the intelligent customer service operation model
1.1 自然语言处理
自然语言处理(Natural Language Processing,NLP)技术通过模拟人类的语言理解和分析能力,实现人机交互、信息提取、语义分析等任务。其核心是将自然语言转换为计算机可读的形式,并借助各种算法和模型完成语义理解、信息提取和文本生成等工作。NLP技术是智能客服系统的核心驱动力,其应用已从基础功能实现向多模态、场景化服务演进[4-6]。
1.2 知识图谱
知识图谱是一种以图形化结构系统化组织、存储和呈现知识的技术框架,其核心是通过“实体—关系—实体”的三元组构建语义网络,揭示事物间的关联性。它融合了人工智能、语义网、数据库与图论技术,旨在实现知识的结构化表达、高效检索与智能推理。知识图谱技术在智能客服场景中的应用已成为提升服务智能化水平的关键技术,其通过结构化知识表示与语义推理能力,显著优化了复杂问题处理、多轮对话和精准服务等关键环节[7]。
1.3 知识训练
智能客服的知识训练是一个持续的过程,主要包括以下几个步骤:(1)数据收集:收集大量与业务相关的问答,包括文本、语音或图像等形式。(2)数据预处理:清洗数据,去除噪音,统一格式,进行必要的分词、标注等预处理工作。(3)模型训练:使用收集到的数据对机器学习模型进行训练,包括选择合适的算法、调整参数等。(4)评估和优化:通过测试集来评估模型的性能,根据评估结果对模型进行调整和优化。(5)部署上线:将训练好的模型部署到生产环境中,开始为用户提供服务。(6)持续学习:智能客服在实际运行中会不断收集新的数据,通过持续学习,模型可以不断优化和改进。
2 智能客服在海关热线中的应用
海关12360热线智慧辅助系统依托智能语音识别、智能语音合成、智能语义理解、智能知识库、深度分析等技术,为坐席提供更高效的辅助工具。通过人工智能技术,给每个坐席配备一个全能助手,在通话过程中对客户信息自动查询,实现高效知识检索,辅助坐席易错点提醒,提升坐席服务效率,为后续多维数据平台分析提供数据出处。
2.1 业务分析
经过多年运行,海关12360服务热线积累了海量资料,这些内容覆盖海关全部门类业务,服务场景全面涵盖对外服务场景,为海关12360热线智慧辅助系统建设提供了充足的数据基础和知识储备。
根据海关12360热线智慧辅助系统模型训练要求,数据加工遵循以下两项原则:一是根据“二八原则”,数据加工人员集中精力处理占日常话务量80%的高频业务类型,通过统计分析企业咨询的频次,梳理出核心业务类别及咨询的TOP问题,重点对其对应的知识条目进行标注训练;二是针对企业拨打热线电话时使用带有地方口音的普通话这一实际情况,专门整理有关热门地区涉及上述高频业务知识的历史通话录音资料,用于语音转文字模型的专项训练。为提高语音转文字的准确率,还系统梳理了海关业务中的专用术语,并进行针对性标注与训练,以增强模型对专业词汇的识别能力。
此外,传统模式下坐席人员通过现有海关12360服务热线话务平台接听电话、记录受理单并流转工单,可提升系统操作便利性与工作效率,给坐席人员提供尽可能便利的使用体验。海关12360热线智慧辅助系统需要与现有海关12360服务热线话务平台对接、集成与数据互通,实现统一工作入口和界面融合。同时,系统自动保存通话音频数据转换的文字信息,为后续对热线受理单、工单内容的深度分析与业务优化做准备。
2.2 业务流程
海关12360热线智慧辅助系统能够实现在话务咨询过程中业务信息实时智能查询推送、知识智能检索、后台全量业务深度分析、完善决策支撑体系,将海关服务热线建设成为一个具有以认知能力为核心的新一代客服平台。
坐席电话接听受理过程中,智慧语音转换模块同时开启语音文件识别,将音频文件识别为文本文件并推送给人工智能支撑模块,人工智能支撑模块通过语义解析,对坐席和客户的对话内容进行理解,并通过机器学习给出辅助答案,推送给对应的坐席。整个海关12360服务热线的全流程数据会通过深度学习分析模块进行多维度数据分析整合以及文本挖掘,最终向业务系统推送分析结果数据。
2.3 系统总体架构
海关12360热线智慧辅助系统采用分布式部署的方式,建设成由“云中心+边缘云”两级联动的架构。云中心提供智慧语音转换模块、人工智能支撑模块、智能深度学习分析模块的全部服务,形成总署向下分发、各节点数据向上汇聚的平台能力共享机制;边缘云主要提供直属海关话务数据音转字功能,并能根据不同话务数据特征训练不同专用模型,满足直属海关个性化语音识别需求。以地域模型为例,用不同方言针对语音模型进行训练,将得出不同地域融合当地方言的专用模型,支持带有地方口音的普通话识别。考虑到需要在全国海关推广,后续需要根据业务情况进行扩容并接入其他海关,因此要求智慧语音转换模块需要提供标准开放接口,支持第三方语音转文字能力接入。语音云平台架构示意图如图2所示。

图2 语音云平台架构示意图
Fig.2 Schematic diagram of the voice cloud platform architecture
如图2所示,边缘云(直属海关)在本地完成语音文件识别后,将文本结果实时回传给总署云中心,并获取由总署统一提供的智能支撑模块和智能深度分析模块的应用服务。
该方案有以下几个优势。(1)边缘侧可以实时做转写处理,让语音处理更靠近源头从而缩短延迟时间。(2)个性化效果服务。通过边缘转写,可以为直属海关提供适合的方言识别和优化方案,根据需求调整模型,带来个性化效果体验。(3)智能调度算法。该算法充分考虑AI模型的匹配度、云平台的负载压力等因素,为用户提供最佳体验的智能服务。
2.4 系统应用架构
为持续优化12360热线智慧辅助系统,满足海关12360服热线务向数字化、智能化、智慧化转型等方面的需求,结合云计算、大数据、智能语音识别、智能语义理解等人工智能技术,依托语音云平台建设AI调度台,在应用层统一建设人工智能支撑模块,为全国海关12360服务热线坐席提供实时智能辅助的支撑服务。同时,在服务层统一建设智能深度分析平台,以海关12360服务热线数据为基础,借助深度学习技术对海量的热线数据进行机器学习和分析建模,为管理者提供舆情监测和热点问题发展趋势的参考,为整体热线运营工作的流程优化和质量改进提供方向[8-10]。
智慧语音转换模块:包括语音文本识别服务、文本转语音服务、人工智能标注训练服务等功能,主要是为总署和直属海关提供在线和离线的话务语音数据的识别转写服务和机器学习训练优化服务。
人工智能支撑模块:通过语义理解等认知智能支撑为坐席实时通话提供辅助服务,包括实时对话转写、话术提醒、知识推荐、实时质检等功能,同时构建基于语义的海关知识引擎,提升知识检索优化效率。
智能深度分析模块:依托数据分析平台和语音文件离线识别分析引擎技术,通过机器学习、深度学习等算法提供话务语音数据的智能化分析能力,构建智能质检系统,包括服务态度与质量质检、热点话务分析、舆情监测功能。
2.5 功能介绍
2.5.1 智慧语音转换
海关12360服务热线积累了大量的语音资源,智慧语音转换模块可对上述语音资源、进行结构化处理,将非结构化的语音资源转换成文字内容,用于支撑全国各直属海关对外服务能力;为保证语音识别的可持续性、可扩展的服务能力,需要定期对语音识别进行升级,以满足语音服务对业务的扩展和支撑需求,智慧语音转换模块示意图如图3所示。
2.5.2 人工智能支撑
依托智能语音识别、智能语音合成、智能语义理解、智能知识库等技术,在现有海关12360服务热线综合服务平台的基础上构建以认知能力为核心的新一代客服体系,人工智能支撑模块在话务咨询过程中实现业务信息实时智能查询推送、知识智能检索、文本内容智能纠错等功能,提升坐席服务效率及服务质量。人工智能支撑模块流程示意图如图4所示。
2.5.3 智能深度分析
智能深度分析模块是通过语音识别将热线语音话务信息转化为文本,结合数据标签、要素抽取、文本自动聚类模型分析、多维建模分析等技术,提供可视化应用,进而对海量语音话务信息的分析处理,最终实现对话务数据的知识挖掘探索,以及语音相关维度的多维统计分析和专题分析。
基于话务数据中的热点问题和舆情信息的抽取和趋势分析,为总署决策提供更加精准的数据参考;基于对全量话务信息的质检分析和对质量效率等专题分析,为热线队伍提供更加有力的管理手段。在数据接入上,智能深度分析模块也支持分属数据汇聚,实现话务数据全面融合。在具体操作上,智能深度分析模块提供可视化操作界面,支持海关内部自定义数据分析维度。在面向对象上,提供多元数据计算功能、多模态信息智能处理与分析框架,满足呼叫中心坐席数据分析需求和专业数据分析人员数据分析需求。
2.6 模型训练优化
2.6.1 单轮对话、多轮对话梳理
根据用户意图及业务复杂度等因素分别梳理单轮及多轮对话。针对来电意图清晰明了、可直接答复的知识条目,作为单轮对话梳理。针对模糊需求、类似问题或用户无法明确区分,需进一步沟通才能准确定位的问题,作为多轮对话梳理,该项任务要求业务人员对海关整体业务有较高的水平、有清晰的思路,比如用户咨询“企业如何备案”,需要进一步咨询企业需要做哪类备案等相关备案问题,梳理多轮问答,准确定位用户问题。
2.6.2 语义扩展
在梳理单轮、多轮对话时,为应对不同咨询人在表达方式和用语等方面的差异,本研究结合语义识别技术,由业务人员参考实际接听过程中不同咨询人多种的表达方式,为每个标准问答设计并生成了3至5个扩展问题,此举旨在覆盖多样化的用户提问方式,从而提升问答匹配的准确率。
2.6.3 海关专业术语库建设
语义识别技术基于语音识别准确率,由于海关业务的特殊性,在自然语言的基础上,需识别海关的专有名词,才能准确识别语义。为实现精准的语义解析,业务人员结合海关政策文件及实际业务,整理出大量海关专有名词,构建结构化的海关领域词典,借助知识图谱技术,建立系统对海关专有名词的识别能力。
2.6.4 知识梳理成果
该系统上线应用以来,在语音层面,通过大规模语音数据标注与名词总结,提升了模型的识别准确率;在算法层面,基于真实通话数据的特征分析,驱动了语音数据特征分析及语音识别算法的持续优化;在知识层面,通过构建涵盖大量知识条目、具备多轮对话与泛化问法能力的知识库,从根本上增强了系统的语义理解与智能服务水平。
3 结语
本研究以海关12360服务热线智能化转型需求为切入点,构建了融合自然语言处理与知识图谱等技术的海关12360热线智慧辅助系统,系统性探索了智能客服在海关服务热线场景中的创新应用路径。该系统上线应用以来,通过语义解析与知识图谱技术,经过持续语音标注、知识训练优化等,实现了语音转写准确率的显著提升与知识的准确智能推送,能够有效提升热线服务效率;通过转写文字及知识推荐内容的快捷录入,能够优化工单填写效率;依托于全面覆盖的实时质检体系,能够有效降低潜在的风险。展望未来,随着技术的迭代与应用场景的深化,该系统将得到进一步完善,具有更加广阔的推广与应用前景。
参考文献
[1]陈芝仪,张亮. 人工智能技术在客服平台中的现状及发展前景[J].信息系统工程, 2024(6): 37-40.
[2]王铮, 任华, 路绪海.人工智能在客服系统的应用及关键技术[J].电信科学, 2018, 34(12): 84-91.
[3]刘国刚. 人工智能客户服务体系的研究与实现[J]. 现代电信科技, 2009(39): 50-54+59.
[4]陈伟. 人工智能在自然语言处理中的研究[J]. 信息记录材料, 2023, 24(10): 92-94.
[5]孙伟, 李一, 马永强. 基于自然语言处理技术的知识图谱构造方法研究[J]. 集宁师范学院学报, 2023, 5(5): 94-97.
[6]符精晶,庞乐乐,张杰礼. 自然语言处理领域中的人工智能大模型应用探讨[J].高科技与产业化, 2024, 30(5): 65-67.
[7]何巍.社交网络舆情多模态知识图谱构建框架研究[J]. 情报杂志, 2024, 43(1): 160-166.
[8]朱自瑛.基于耦合仿生的多模态交互设计方法研究[J]. 包装工程, 2020, 41(12): 99-105.
[9]宋双永,王超,陈成龙,等. 面向智能客服系统的情感分析技术[J]. 中文信息学报, 2020, 34(2): 80-95.
[10]严昭. 基于J2EE框架的智能电网在线客服系统的设计与实现[J]. 电力大数据, 2022(25): 75-85.
基金项目:国家重点研发计划项目(2020AAA0108700);海关总署科研项目(P0020200003)
第一作者:原玉芬(1977—),汉族,河南焦作人,硕士,高级项目管理师,主要从事海关软件项目需求分析等工作,E-mail: 210810270@qq.com
通信作者:安静(1985—),汉族,河北石家庄人,本科,中级人工智能算法工程师,主要从事海关12360热线知识库管理等工作,E-mail: 397972204@qq.com
1. 中国电子口岸数据中心 北京 100088
1. Data Center of China E-Port, Beijing 100088

图3 智慧语音转换模块示意图
Fig.3 Schematic diagram of the intelligent voice conversion module

图4 人工智能支撑模块流程示意图
Fig.4 Schematic flow diagram of the artificial intelligence support module