CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
大数据驱动企业画像在海关纳税人管理中的应用
作者:文习伟1
文习伟1
摘 要 介绍企业画像及大数据的概念、发展和应用,结合海关税收征管制度中企业管理方式的变化,对大数据驱动的企业画像在属地纳税人管理工作中的应用方向进行分析,对目前存在的问题提出解决及完善建议。
关键词 属地纳税人管理;大数据;企业画像
Application Analysis of Big Data-driven Enterprise Portrait in the Management of Customs Taxpayers
WEN Xi-Wei1
Abstract Introduce the concept, development and application of big data and enterprise portraits.Analyze the application direction of big data-driven corporate portraits in the localized management of taxpayers according to the evolving changes of enterprise management methods in the customs tax collection system, and put forward suggestions to resolve and improve existing problems .
Keywords localized management of taxpayers; big data; corporate portrait
引言
在海关总署推行的纳税人属地化管理改革中,企业画像作为纳税人属地化管理方案的核心内容受到广泛关注。采用企业画像的方式可以有效挖掘海关历史进出口数据在动态管理上的潜力,帮助海关对企业的各阶段行为进行预判、筛选和甄别,并为后期稽核查提供有针对性的方向,有效提高海关全过程管理的有效性,并凸显海关追随新科技潮流、勇立时代发展潮头的魄力。
根据《属地纳税人管理框架方案》(以下简称《属地方案》),属地纳税人管理主要由企业底账、后续管理、合规评估和精准纳税服务四部分构成,其中企业底账是某一时点静态数据形成的基础,后续管理不断对其补充完善,合规评估和精准纳税服务是在掌握准确信息的基础上对企业信息的实际应用。框架方案表明,企业底账和后续管理内容构成了企业画像的基本内容,企业画像作为属地管理的核心环节,它能否做到全面、翔实、准确,关系到能否为后续应用提供强有力的支撑。
1 画像的定义、历史与发展
企业画像是以企业为对象的用户画像,指对企业整体信息按照不同维度的指标进行切片归纳,将信息数据标签化,通过收集和分析企业的基本特征、社会属性、决策历史和行为习惯等数据,提炼出各指标范围的典型特征,将诸多企业的同性质数据重新整合抽象为一系列特征标签的数据集合。这个数据集合不仅是特征标签的集合,也是数据来源的集合。切片维度的细致度与数据提炼难度正相关,与后期使用的参考有效性也正相关。
用户画像本质上是一种统计化的数据集合,是诸多真实个体的数据按标准拆分后重新组合的数字化描述集合。它最初来源于交互设计领域,交互设计之父 Alan Cooper 较早提出了用户画像(persona)的概念,并指出用户画像是真实用户的虚拟代表,是建立在真实数据之上的目标用户模型[1]。用户画像最初用于交互设计领域,通过总结提炼客户总体特征,从而确定需求方向和设计方向,将设计的主观描述转换为客户特征需求,是一种联系需求和设计的工具。
近年来,随着互联网行业的迅猛发展,用户画像的概念也在发生演变。互联网技术在数据收集的深度、广度和细度上的优势,远超传统手段,用户画像的数据基础逐渐脱离了原来的小范围样本统计,而转变为更广泛、更细碎的海量数据,即“大数据”。通过对用户打标签、建立数据模型来解读“全样本”用户的行为特征,成为互联网产品设计及运营的趋势。
2 大数据与企业画像
根据维基百科的定义,大数据又称巨量资料,指在传统数据处理应用软件不足以处理大的或复杂数据集的术语,它有三个特点:规模性、多样性和高速性[2]。大数据以一种全面覆盖、多维表现以及快速更新的“特征云”形式,将所含信息全部展现出来,对大数据的应用需要以建立数据模型的方式对原始数据进行加工整理,而非对数据的直接引用。
大数据驱动的企业画像是在特征管理领域对大数据的应用,以大数据集合作为企业画像的数据基础,一方面通过画像的方法论维持其有效性,另一方面以大样本数据削减人为误差而增强其可信度。
基于大数据平台的企业画像有两个主要特征。一是真实性和客观性。企业画像是虚拟化的企业形象,是真实的特征数据标签化重组后的虚拟体现,因其数据来源的广泛性,它所体现的特征已不再是具体企业的个性特征,也不是全体样本的平均化特征,而是以特征标签为线索形成的特定群体的典型特征,它从整体上反映了以标签特征为共同点的企业的普遍形象。
二是企业画像代表企业群体的大概率行为,不代表全局性必然行为。基于大数据平台的企业画像通过对企业属性或维度的标签化和结构化,形成对企业行为的分层分类分析,而不是企业数量之间的统计分析,代表了企业的一种全局性大概率行为特征。当然,通过对画像集的持续迭代、知识库的持续迭代等工作,可以提高对所覆盖样本个体行为概率的判断水平。
从技术管理角度来看,基于大数据平台的用户画像构造分为三步:第一步是搭建用户画像技术架构,如数据整理、平台和应用等;第二步是用户画像数据分类;第三步是用户画像构建,包括精准识别、动态跟踪行为轨迹、结合静态数据评估用户价值、确定用户标签与权重、不同群体优先级排列等[3]。
3 通过企业画像进行海关属地纳税人管理
在全国通关一体化改革方案中,纳税人管理主体由申报地管理向属地管理转变。这种模式下解决了通关一体化产生的管理职能碎片化的问题,但也给属地海关带来了新的课题:如何对非本口岸发生的进出口行为进行管理和评估。
3.1 企业画像
纳税人企业画像为属地管理提供新思路。这一思路是指从顶层设计开始,按照行业、商品和其他可识别的标准建立可供属地直接使用的企业画像标本,属地海关在实际管理中,以具体企业数据与之交叉比对,从而确定管理方向和重点,以达到科学管理属地纳税人的目的。
3.2 智慧海关
“智慧海关”为智能化纳税人管理打下良好的数据基础。随着新技术的发展,基于大数据驱动的数据挖掘技术也日渐成熟,“智慧海关”计划中各科技系统陆续上线,为智能化纳税人管理打下良好的数据基础。《海关大数据管理办法》中对海关大数据的来源、管理、使用和保障作了明确规定。《海关税收征管方式改革实施方案》中明确:“以技术创新为驱动,通过大数据、云计算、移动互联等新技术,推动征管作业流程、管理手段的集约化和智能化。”
4 大数据驱动企业画像的应用
4.1 合理构建企业画像系统的应用制度
(1)大数据的体量决定了系统应从顶层设计出发,以事实为依据,科学设计,合理规划,有序推进,开展系统的建立、完善、维护、调整和更新。企业画像覆盖企业的方方面面,系统的数据来源包含全面的报关单历史数据、外汇、银行、境外厂商、商品、行情等诸多方面,这些来自多领域跨部门的数据需要持续不断更新,更新频率不能太低,为排除人为产生的干扰最好自动提取,以确保数据的客观性,这是一个庞大的系统工程。数据的分类挖掘,建立特征集合,以统计学知识建立数据模型,依模型对数据进行分析归纳,最后构建可用的企业画像成果,加上后期对系统的更新维护,这些工作所需要的智力资源还很多。这项工程涉及的范围广、工作量大、资源多,只有从顶层设计开始。
(2)以属地海关为主体,对企业画像进行使用、评估、反馈。通过直接使用顶层搭建的企业画像,属地海关根据评估需要,将目标企业的实际数据与对应企业画像指标进行初步比对评估,实际数据偏离指标值时,意味着可能存在风险点,属地海关据此开展具体核查,并根据核查结果向系统反馈指标准确性偏差,系统维护部门根据属地海关反馈信息,对系统指标进行调整完善。
4.2 设计弹性的企业画像数据结构
(1)搭建基于特征的数据结构。企业画像作为众多样本企业的群体画像,在整体和概率上反映样本企业的行为特征。这些特征根据企业所处行业、进出口商品、贸易渠道等划分维度不同,在特定指标上会存在显著差异,反映到企业画像结构上表现为不同特征维度应保持独立,以提高特征的指向性。为达到准确评估的目的,企业画像的数据结构在设计时,需要针对样本企业的不同属性设定评估维度并建立参照指标,对于数据的分类、统计、汇总,需根据统计学模型建立不同维度的数据模型。
(2)数据结构设计首先要考虑保持弹性和冗余度。企业画像结构设立后,随着时间的变化,企业会根据外部环境的变化对自身的经营活动进行调整和分化,如行业细分、进出口流向改变等,反映到企业画像上或者会导致原来设定的指标发生偏移,或者导致维度细度发生变化,从而使企业画像对于个体企业的参考性下降,此时就需要对数据结构进行修正,所以在系统构建之初就应该给后续的调整留下空间。
4.3 拓展数据采集范围,完善内外部数据采集
大数据不同于一般的大量数据,其应具备的数据深度、广度和细度远超传统意义上的数据集合,数据的广度和量级都需要具备统计学意义上的大尺度,仅仅是现有的进出口报关记录及相关的衍生数据,即使加上进出口相关的收付汇、银行资金等维度,仍达不到准确描述企业形象的目的。为判别企业风险,除了海关管辖范围内的进出口行为直接相关的企业、商品、价格、原产地等信息外,其他与这些要素相关联的信息,如商品本身的境内外行情、世界范围内商品的生产分布、上下游商品的行情、境外厂商的合规记录、关联企业的状况、行业商业模式等,都会影响企业的税收风险评估结果,都应纳入数据采集范围。
随着海关业务改革的不断深入,越来越多的海关业务开始通过科技系统在线处理,但数据联通尚未全面普及。为建立完整准确的企业画像,作为内部数据直接来源的各科技系统要做到互联互通,至少应有完善的数据抽取平台的支撑,从顶层设计就要有严密的逻辑、科学的规划和合理的推进步骤,在科技系统的设计和部署上进行有效的系统整合。
4.4 避免精细画像的误区
属地纳税人管理制度出台后,有人提出精准画像的概念,称其为企业画像的精细化版本,将其试图作为纳税人管理的更精细、更准确的评估基础。
精准画像,顾名思义就是对企业状况精细而准确的描述。如果这里的画像特指个体的精细化特征描述,因其取样对象所限,内容仅为该个体的历史数据及现状的归纳总结,这种总结能否真实反映该个体的实际特性尚未可知,更难说对未来的预测能有多少现实意义。
如果在上述企业画像的概念基础上对具体企业的特定化描述,其精准的要求又与企业画像统计性及概率性的本质相违背。
企业画像与大众意义上的互联网用户画像不同,互联网用户画像的最突出用途在于:通过个体的海量数据勾勒本人的行为特征,以推测可能的消费倾向。而企业画像因个体数据有限转由群体数据抽象整合,以提炼群体特征作为代表性样本。其最适合的应用场景是作为某个特征的群体评估样本,以其为标尺设立一系列的评估标准值,通过将企业的实际数据与之比对,筛选出指标不同于整体标准线的个体,并以相应的指标作为进一步核查的方向。
5 结语
在数据驱动环境下,数据作为一种资源,各行各业日益重视数据赋能,充分利用数据潜力,实现数据红利。企业数据是需求日趋碎片化、多元化、精细化的重要体现,如何挖掘企业数据,全面掌握企业禀赋,发挥数据价值,是实现海关精准监管和高效服务的关键点。基于企业数据构建全方位立体化的企业画像,为海关监管和服务提供了新的思路和方向。对企业而言,合理的个性化需求得以满足,对海关而言,通过对企业特征的分析和动态的把握,实现精准监管和高效服务,提高行政效率。
【该文经CNKI学术不端文献检测系统检测,总文字复制比为12.4%。】
作者简介:文习伟(1977-),男,汉族,浙江宁波人,本科,现任鄞州海关综合业务科二级主办,E-mail:wenxiwei@customs.gov.cn
1. 鄞州海关 宁波 315100
1. Yinzhou Customs, Ningbo 315100
参考文献
[1] Alan cooper.交互设计之路[M].电子工业出版社, 2006.
[2]维基百科 https://zh.wikipedia.org/wiki/大数据.
[3]席岩,张乃光,王磊,张智军,刘海涛.基于大数据的用户画像方法研究综述.广播电视信息, 2017(10): 37-39.
(文章类别:CPST-A)