CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
产品风险画像技术在跨境电商质量安全监管中的应用研究
在互联网和数字经济快速发展的时代,跨境电商作为进出口商品的新模式,成为了经济和外贸增长的新亮点和新动力[1]。海关总署的统计数据显示,2021年我国跨境电商进出口1.92万亿元[2],5年增长近10倍,快速发展的跨境电商贸易给海关进出口商品监管工作带来了严峻挑战。在跨境电商产品的质量安全监管方面主要存在如下问题:一是根据跨境电商业态特点,产品将作为个人自用进境物品施行监管。在国内外安全标准要求不一致时,允许仅满足国外标准要求的产品入境销售,在一定程度上存在质量安全风险;二是跨境电商产品货值低、种类杂、数量多,带来的安全风险呈现出碎片化、多样化的特征,监管难度较大[3-4]。
当前,中国海关对跨境电商质量安全的监管方式正在向以风险管理为主线的风险预警和快速反应监管体系转变。由于跨境电商在信息化方面的天然优势,在外部互联网数据库和海关内部的各类监管及业务系统中都存有各类跨境电商产品的品类特点、不合格项目、通报案例等丰富的数据信息。本研究探索利用大数据技术为基础的产品风险画像手段,多维度收集整理内外部数据仓库中的产品特征、风险信息和业务数据,科学描绘监管对象质量安全风险信息结构化的全景图,从而支撑跨境电商质量安全风险监管体系建设,为海关精准、高效地把控跨境电商质量安全风险提供一种可行的解决思路。
1 产品风险画像的概念及意义
随着互联网技术的发展,数字化进程不断加速,如何从海量增长、异构多源的数据中提取有价值的信息成为大数据时代的一个重要问题。用户画像(user profile)正是这一思路的具体实践。这一技术通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,对用户特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌[5-6]。
多维数据信息结构化、标签化的思路也被吸纳并应用于风险管理和风险评估领域。张晓磊等[7]从我国股票市场行业和个股价格数据中挖掘风险信息,通过量化指标的构造形成了行业风险画像;郑留洋[8]以车联网大数据为背景,从货车轨迹数据、动态数据、预警数据等提取关键数据,形成了车辆出行风险画像;王皎贝等[9]基于公开病例信息及相关POI数据,研究了新冠疫情的时空演化及风险画像。在海关监管领域,也有利用大数据绘制进出口企业画像,从而实现智慧高效的监管和服务的研究[10-11]。
产品风险画像的概念源自上述各类应用和实践,是针对海关监管的跨境电商产品,通过采集产品与质量安全风险相关的多维度数据,再进行信息识别和结构化处理的一种数字化呈现技术。对琳琅满目的跨境商品进行产品风险画像,一方面是数字化时代海关监管工作的必然方向。海关长期从事各类进出口商品的质量安全风险管理和评估工作,然而传统单线条、二元结果化的检验检测工作模式已经无法满足口岸快速通关需求,难以适应多样、复杂的风险对象,并且与《“十四五”海关发展规划》中提高海关信息化支撑能力、加快海关数字化转型的要求存在一定距离。另一方面,这是快速通关、服务经济场景下海关监管工作的现实需要。跨境电商业态的特点可能带来多样的质量安全风险,给消费者带来一定威胁。海关作为口岸监管和执法机关,如何在便利通关的前提下,从海量跨境电商产品中准确、快速、甚至提前锁定可能发生的风险,让有限的监管力量发挥最大效用,是目前工作中面临的实际问题。
综上所述,在海关数字化转型和质量安全风险精准化防控的交汇点,利用产品风险画像技术对跨境电商产品的风险监测和评估工作进行预处理,进而通过全面的信息感知,支撑高效的风险把控和清晰的结果输出,具有重要的现实意义。在此背景下,本研究从跨境电商产品入手,研究对其进行产品风险画像的实现技术,并给出该方法在具体跨境电商产品监管中的应用示例。
2 产品风险画像的实现技术
在产品质量安全监管领域,监管机构最为关注的是产品可能对使用者和环境造成伤害的各类风险。因此,在对跨境电商产品进行产品风险画像时,应当在充分理解产品特征属性的基础上,从伤害模型视角,有针对性地制定数据指标体系,选用合适的架构开展数据收集和结构化存储,并根据使用场景的不同灵活选取可视化展示方式,从而绘制出一张针对性强、问题清晰、展示直观的风险全景图。
2.1 数据指标体系
传统画像可选择的视角很多,而跨境电商产品风险画像应当周密考虑该类商品经由跨境电商平台从国外进口至国内,并在流通领域销售全流程所涉及的数据信息,从伤害模型的视角出发,有针对性地制定数据指标体系。美国CPSC和欧盟RAPEX对消费品历年安全风险及事故数据都进行了详细地通报[12]。消费品固有的物理、化学、生物安全风险可能导致生理、心理、财产、社会性的伤害。从统计数据来看,起火、电击、窒息、烧伤、割伤、中毒、细菌、听力损伤、视力损伤为排名前十的伤害类型。
根据上述分析,本研究中的产品风险画像数据指标体系如图1所示。该体系根据数据涵盖范围的差异,主要包括两大类五小种指标。
两大类指标分别为产品风险特征类和品类风险特征类,它们的区别在于:产品风险特征聚焦某一特定产品固有的基础属性、监管信息及风险属性3种特征数据,而品类风险特征主要关注同类商品存在的风险案例通报情况及实验室检测不合格项目的情况。
具体到五小种指标,它们也各有侧重。其中,基础属性包括产品编号、品名、购买平台、制造国、品牌、售价、销量、好评率等。监管信息主要是跨境电商产品在进入保税区入关报关和进行包裹出区清单申报时产生的海关监管数据,包括HS编码、进口口岸、产品获得的认证证书等。风险属性包括一级属性-风险类和二级属性-风险源。风险类包括电气、机械、着火、化学、生物、辐射等;风险源则根据风险类进一步细化,如电气类风险可能包括高压电击、电磁辐射等;机械类风险可能包括运动部件割伤、夹伤等。针对不同风险源,需要明确相关关键参数。如电气类风险源需要额定电压、额定功率等;机械类风险源需要收集材质、转速等信息。通报信息类指标需要收集待评估的一类产品被通报的数量、通报国数量,并且记录每个通报中包含的产品信息、伤害类别和风险等级。另外,还可从海关实验室掌握的检测报告中提取不合格项目的风险类别和不合格率等数据,作为通报信息类指标的补充或替代。
从数据来源的视角来看,跨境电商产品的基础属性和通报信息属于外部信息,需要设计数据传递接口或规范数据发送格式,从跨境电商企业和其他政府部门获取相应数据;监管信息、风险属性及检测报告则属于内部数据,需要开发数据提取和识别程序,对分布于多个信息系统的数据进行收集和处理。
2.2 数据获取与存储
跨境电商产品的生产、销售、运输、使用及监管等各个环节涉及不同的政府监管部门和市场主体,因此需要设计涵盖各来源的数据获取方式及存储架构,利用数字政府协同治理平台和各类监管报关信息系统,获取来自跨境电商企业申报、地方政府监管以及海关各业务部门等不同来源的信息。上述数据获取架构如图2所示。
图2 数据获取架构
Fig.2 Structure of data collection
在数据获取方式上,主要依托海关和地方政府大数据局在数字化改革中建设的数字政府协同治理平台,采用规范化的数据采集模块对各来源数据进行录入和处理。利用这套系统,可以对产品的基础信息和参数、海关跨境电商监管数据、政府监管部门及消费者保护机构发布的事故和召回报告、消费者产品投诉信息等信息进行高效率收集和结构化处理,构成基础属性、监管信息和通报信息三类指标,并存入数据库对应表单。在生成一个产品风险画像项目后,基础属性表、通报案例表和检测报告情况表均留有动态修改的接口,可随实时更新的数据进行动态修改;风险属性相对固定,主要是根据产品品类的特点形成知识库,并在数据库中录入,在初始化后不会再进行频繁改动或内容增添。
在获取相关数据后,为了方便后续操作,还需要将上述数据按标签进行分表、分区存储,分别操作,每个表内都按数据标签指标体系的设计存储相关信息。实际表单存储结构将在后文中进行详细讨论与介绍。上述标签表的存储可以采用传统的MySQL数据库进行存储,也可以采用Hive等更适合大数据量批处理作业的数据仓库。
2.3 产品风险画像绘制与可视化
在获得多维度数据后,即可着手对产品风险画像进行绘制和可视化呈现。首先,根据画像需求,挑选分区存储的各表单中命中的标签进行汇聚,得到信息汇聚于一个字段的全量标签。根据全量标签进行可视化处理时,最常规的方法就是直接按照标签存储的结构,用表格图方式,对收集的信息进行层级化逐项展示。在表格图的基础上,可以根据展示数据的特征,增加散点图、饼图、柱状图、甘特图、桑基图等多样的可视化展示形式,形成涵盖多种产品风险画像、具有统计分析功能的数据驾驶舱。此时的画像可以动态更新,作为一类产品风险预警的指标使用。例如,某天数据库更新了新的通报案例或严重风险警示,可以立即传送给监管部门,提高响应速度。此外,可视化也可采用更加直观的方式呈现,例如采用词云图方式将伤害或召回案例通报、消费者向消保机构的投诉等内容中出现频率高的关键词突出显示,使得产品风险画像的重点一目了然,更加便于传播。上述大数据驾驶舱和词云图在其他领域的应用示例如图3所示。
3 产品风险画像绘制示范
毛发护理器具是跨境电商进口的热门产品种类,主要包括电吹风机、烫发器、卷发棒、直发器等电器类产品。由于不同国家插头规格不同,并且美国、日本标准体系与我国等同的IEC标准体系存在差异,使跨境电商进口的毛发护理器具在国内使用时存在一定风险。2021年,国家级进出口商品质量安全风险评估中心(杭州)对此类产品进行了风险监测,结果显示19批产品中有12批存在不合格项,不合格率高达63.2%。因此,本研究选取毛发护理器具中热门产品电吹风机作为产品风险画像的应用示例。根据前文关于产品风险画像实现技术的讨论,按照数据指标体系建立、数据获取与存储、风险画像绘制与可视化3个步骤对一款进口电吹风机进行风险画像。
3.1 数据指标体系的建立
电吹风机是一种利用大风力风扇将电加热丝产生的热量扩散到人体皮肤和毛发表面的家用电器。从伤害模型的视角出发,电吹风机可能产生的伤害主要是电击、灼伤、起火等物理伤害。据此,确定其基础属性表包括风险产品编号、品名、品牌、型号、产地、购买平台、价格、销量、好评率、敏感评价详情等信息;确定其风险属性表中风险类为物理伤害,风险源为电击、灼伤、起火3类,风险源相关的额定电压、最大功率等部分数据也需要进行收集;案例情况表整合了协同治理平台传递的12315消费者投诉平台的相关数据,表内详细的数据存储结构见表1。
表1 数据标签存储结构
Table 1 Data storage structure of product risk profiling
项目类型 | 字段 | 字段类型 | 定义 | 备注 |
(riskprofile.basicinfo) | Id | integer | 编号 | 必要 |
Name | varchar | 品名 | 必要 | |
Brand | varchar | 品牌 | 必要 | |
Model | varchar | 型号 | 必要 | |
Origin | varchar | 产地 | 必要 | |
Platform | varchar | 购买平台 | 必要 | |
Price | float | 价格 | 选填 | |
Sales | integer | 销量 | 选填 | |
Good com-rate | float | 好评率 | 选填 | |
Bad comment1 | varchar | 问题评价1 | 选填 | |
Bad commentN | varchar | 问题评价N | 选填 | |
(riskprofile.supervisioninfo) | HScode | integer | HS编码 | 必要 |
ImportCountry | varchar | 进口国 | 必要 | |
ImportPort | varchar | 进口口岸 | 必要 | |
Declaration | integer | 申报方代码 | 必要 | |
E-commerce | integer | 电商代码 | 必要 | |
Certification | varchar | 认证证书 | 选填 | |
(riskprofile.riskinfo) | RiskType | varchar | 风险类 | 物理 |
RiskSource1 | varchar | 风险源1 | 电击 | |
RiskSource2 | varchar | 风险源2 | 灼伤 | |
RiskSource3 | varchar | 风险源3 | 起火 | |
RatedVoltage | integer | 额定电压 | 必要 | |
MaxPower | integer | 最大功率 | 必要 | |
Classification | float | 器具分类 | 必要 | |
PlugType | integer | 插头类型 | 必要 | |
CableLength | float | 线缆长度 | 选填 | |
(riskprofile. cases) | CaseAmount | integer | 通报数量 | 必要 |
CountryStat | varchar | 通报地区 | 必要 | |
Doc_ID_1 | integer | 案例编号 | 选填 | |
Doc_content_1 | varchar | 案例内容 | 选填 | |
Doc_ID_N | integer | 案例编号 | 选填 | |
Doc_content_N | varchar | 案例内容 | 选填 |
3.2 数据获取与处理
在数据获取前,首先建立一个名为Product_Risk_Profile的数据库,并按表1所述结构所示建立4个独立表单。风险画像项目的元数据可以在此数据库中进行录入和维护,为后续的可视化工作做好准备。
上述数据标签表中,基础属性表主要是利用电商平台分享渠道以及进出口商品质量安全风险管理系统,从跨境电商平台和申报企业等来源获取;监管信息从H2018海关通关管理系统和金关二期特殊区域管理系统中导出;风险属性表中的风险类和风险源是通过分析对象产品风险特点,采用主动录入的方式写入数据库;通报案例表中,通过前述协同治理平台传递全国12315平台和相关质保信息系统的数据并存入表中。随后,可将上述结构化数据存储于已经建立的数据库对应表单中。上述流程及原理如图4所示。
3.3 产品风险画像绘制的实践
根据前文分析,在进行产品风险画像绘制时,首先基于采集的四类信息进行聚合操作,并生成标签图,如图5所示。在标签图中,可以一目了然地看到评估对象产品的基础属性、监管信息、风险属性及召回案例概况,为监管工作中的风险评估及快速风险预警提供信息支撑。
与此同时,若需要对风险产品的详细召回情况或消费者投诉情况中潜在的风险进行分析,则可调取相应表单中的数据,再通过饼图、柱状图、甘特图或词云图的绘制实现进一步的分析和呈现。本研究以词云图为例进行演示。词云图的绘制分为3个步骤:将存储于数据库表单中的案例内容或消费者评价内容聚合到一个文档中,随后调用AI分词函数库对文档进行操作,最后调用词云图函数库,统计词频并绘制图像。以电吹风机品类通报案例内容和12315平台消费者投诉数据为基础分别生成的词云图,如图6所示。从词云图生成结果可以看到,通报案例的关键词呈现更为精准,但消费者投诉的原始数据中存在更多干扰信息,需要额外的数据清理手段。
通报案例词云图 消费者投诉词云图
图6 产品风险画像可视化示例
Fig.6 Example of visualization of product risk profiling
4 产品风险画像在海关监管工作中的应用
当前,我国海关对跨境电商质量安全的监管已经引入了风险管理为主线的风险预警和快速反应监管体系,该体系主要包含如下环节:海关总署或直属海关对跨境电商产品质量安全风险监测计划的制订;各风险监测点开展的风险信息收集、风险监测及产品检测工作;各风险评估中心组织开展的风险等级评估;以及基于风险评估结果的风险处置与消减措施报告等环节。本研究中的产品风险画像技术作为一种通用、灵活的产品风险特征数字化呈现手段,可以应用于上述工作的多个环节,起到良好的支撑作用,如图7所示。
在制定跨境电商质量安全风险监测计划时,可以利用产品风险画像技术对备选产品进行画像,厘清各类产品的风险要素及特征,比较它们各自的质量安全风险严重程度,为科学制定风险监测计划提供依据。
在风险监测环节,产品风险画像可以作为数字化监测手段,达到“无时不在、无事不扰”的效果。相关程序平时在后台连续运行,动态更新一类产品的风险画像,协助风险信息收集整理,为高效开展下一步风险评估工作提供支撑。若监测到来自于监管部门及消费者保护机构通报的案例,或者检测机构的不合格报告案例达到一定数量,实现立即响应。一方面,可以迅速安排电商平台或保税仓的样品抽检,进而开展后续监管作业;另一方面,可根据风险情况的严重程度增加专项风险监测计划,向各口岸发出风险预警,助力监管链条前移。
在风险评估环节,融合了产品特征、风险信息、监管数据的产品风险画像,可以弥补采用德尔菲法评估时专家意见的独立性、可重复性难以保证的问题,通过对每个待评估的产品进行详细的产品风险画像,为专家提供更加丰富全面的前置信息,使得风险等级判定更加科学高效。
在风险处置阶段,产品风险画像技术可以生成更加直观的产品风险特征图,为监管人员选择风险处置方案、规范完成风险消减提供数据辅助。产品风险画像项目所积累的历史数据可以形成更加完善的处置方案模板,对于相似情况的风险产品可直接调用处置模板,提高工作效率。
可以说,风险画像技术的运用可以更加全面、实时、精准地锁定监管对象的风险特征,且更加直观地将收集到的风险信息呈现出来,为高效精准地开展跨境电商质量安全监管工作提供技术支撑。
5 结语
在互联网时代,利用数字化技术对种类繁多、风险各异的跨境电商产品进行产品风险画像,既是大数据背景下海关监管工作的发展方向,也是海关在守牢国门安全的同时保障快速通关的现实需要。本研究借助大数据技术中用户画像的概念,研究了产品风险画像的实现技术,探索了产品风险画像在跨境电商质量安全风险监管工作中的实现路径和效果,并以跨境电商中安全风险较高的电吹风机产品为代表,给出了应用实例,为高效精准开展口岸跨境电商产品的风险评估及监管工作提供了一定参考。下一步,研究团队将考虑进一步丰富风险信息来源,扩展来自国内外各类机构的公开信息,持续优化产品风险画像过程中遇到的数据筛选问题和呈现方式,为跨境电商质量安全监管中后续的风险评估和风险处置环节提供有力支撑。
参考文献
[1]李向阳.跨境电商监管的国际实践和经验借鉴[J].海关与经贸研究, 2019, 40(3): 50-61.
[2] 2021年跨境电商进出口情况[EB/OL]. http://www.customs.gov.cn//customs/resource/cms/article/333551/4312152/20220424083 55073518.doc, 2022-04-24.
[3]李和平, 黄河清, 李维, 等. 跨境电商监管主要问题及标准化解决思路[J]. 中国口岸科学技术, 2020(5): 69-74.
[4]丁佳乐. 打造跨境电子商务质量安全生态圈多元共治格局[J].海关与经贸研究, 2020, 41(2): 72-79.
[5]亓丛,吴俊.用户画像概念溯源与应用场景研究[J].重庆交通大学学报(社会科学版), 2017, 17(5): 82-87.
[6]刘海鸥,孙晶晶,苏妍嫄,等.国内外用户画像研究综述[J].情报理论与实践, 2018, 41(11): 155-160.
[7]张晓磊,胡孙阳,赵海涵,等.股票市场行业风险画像方法与应用研究[J].价格理论与实践, 2018(9): 107-110+138.
[8]郑留洋. 基于车联网数据的货车出行风险画像与影响因素分析[D]. 北京: 北京交通大学, 2019.
[9]王皎贝,李钢,王建坡,等.陕西省COVID-19疫情时空演化与风险画像[J].热带地理, 2020, 40(03): 432-445.
[10]徐强.试论大数据标签化在进出口企业画像中的运用[J].中国口岸科学技术, 2020(11): 32-37.
[11]文习伟.大数据驱动企业画像在海关纳税人管理中的应用[J].中国口岸科学技术, 2020(8): 37-40.
[12]林璐瑶,汤万金,李仲学,等.消费品风险评价的伤害情景与三维矩阵集成方法[J].中国安全生产科学技术, 2014, 10(4): 178-184.
图1 产品风险画像数据指标体系示意图
Fig.1 Data structure of product risk profiling
图3 几种产品风险画像可视化方法
Fig.3 Visualization for product risk profiling
图4 数据采集及存储示意图
Fig.4 Diagram of the data capturing and storage process
图5 产品风险画像可视化示例—标签图
Fig.5 Example of visualization of product risk profiling: tags graphics
图7 产品风险画像在监管工作中的应用途径
Fig.7 Application of the product risk profiling in the supervision of the cross-border e-commerce commodities