数据挖掘技术在税务稽查中的应用(2)
时间:2025-07-10
时间:2025-07-10
数据挖掘技术在税务稽查中的应用
「Tax collection and Management 税收征管」
①
术方法以及税务稽查主体素质的改变等。如何利用网络模型对诚实纳税企业和非诚实纳税企业进行分类。研究中选用19 个财务比率指标,构建了三层的网络结构。由于BP神经网络方法对处理非线性问题具有明显的优势,其判别结果与统计分析中的判别分析方法比较,BP的效果要明显好一些。
与分类不同,聚类要划分的类是未知的,它完全是根据数据在各变量上的取值的相似性进行的。聚类方法是指系统根据纳税户属性,使群内纳税户具有最大的相同性,群间纳税户具有最大的相异性,自动产生聚类标准,再按此标准对纳税户进行归类。通过对分行业、分税种聚类分析的研究,可以更快地将存在不同疑点的纳税群体进行分类,确定各个类别的总体状况和特征,为制定稽查计划提供决策依据,使得税务稽查工作更具科学性和针对性。
3.异常纳税户的分析。通过离群点的分析可以发现异常纳税户。离群点是不符合数据的一般模型的数据
先进的计算机技术和工具对电子商务进行“网上稽查”,成为各级稽查部门需要思考和探索的问题。
(二)信息资源整合为税务稽查提供数据分析平台
随着中国税收征管信息系统(CTAIS)省级数据集中方式的全面推行,以及整合主体应用系统的逐步实施,税务系统的信息化正由扩张走向信息资源整合和数据集中管理的阶段。数据整合使业务数据集中处理迈向新台阶,不仅带来了数据处理平台的全面提升以及系统间信息交换共享的实现,而且也为税务稽查工作的数据分析带来了新的契机,给稽查工作提供了一个统一的、全面涵盖纳税人涉税信息的数据平台,使前沿的数据分析、挖掘技术有了发挥作用的基础,开辟了数据信息向知识信息转变的通道。
三、数据挖掘技术在税务稽查工作中的应用对象,对于聚类分析来说,就是那些散落在外,不能归并到任何一类中的数据对象。离群点中可能隐藏着重要的信息。税务稽查部门在选案过程中,先从数据仓库中根据企业的规模、行业、地区等维度查找出若干企业,将这些数据再用数据挖掘的有关方法查找纳税额明显偏低的企业,可以将他们作为重点检查对象进行稽查。
4.选案规则提取。在很多情况下,稽查人员需要得到如“IF(属性a)AND(属性b)……THEN纳税户是否被确定为稽查对象”等一些直观的选案规则,我们可以采用粗糙集、决策树、关联规则算法② 等辅助进行选择。应用实例:《基于决策树的税务稽查计算机选案》一文中利用决策树提取11条规则,并将挖掘规则应用于实际的地税征管信息系统进行计算机选案。
(一)选案环节
1.选案指标的建立。税务稽查选案评价指标的选择和确定, 是直接关系到评价结果的一项最重要的基础性工作。从理论上讲,设置的指标越多选案内容就越丰富,越有深度和广度。但是,实际选案中采用的指标并不是越多越好。其中有些属性(指标)是与问题无关、弱相关或冗余的,对这些属性必须继续检测识别和删除,否则会影响选案的效果。
属性约简是粗糙集理论研究的核心内容之一,粗糙集分析方法仅利用数据本身提供的信息,无须任何先验知识,能在保留关键信息的前提下对数据进行化简并求得知识的最小表达。 利用粗糙集等数据挖掘方法,对纳税户的属性(指标)进行简化,可以提高选案系统潜在知识的清晰度。
2.纳税群体的细分。为了准确地定位稽查对象,对辖区内纳税户的细分是非常重要的。一般有两种方法:分类和聚类。
分类是指事先人为根据纳税户属性确定分类标准,再对其进行归类。目前选案大多采用将纳税人简单的分为有疑问和没有疑问两种类型。有许多数据挖掘算法可以应用在分类分析中,例如决策树归纳、贝叶斯分类、神经网络等。应用实例:《神经网络在税务稽查选案中的应用研究》一文中利用 BP
(二)实施环节
在稽查实施环节中,要根据查处的问题进行定性。在定性和处罚过程中,其中违法违章类型有8种,
③
违法违章手段有100多种,违法违章成因有4种,根据
违法税款大小和《税收征管法》来进行处罚。税务人员通常是根据经验和查询相应的法律法规来决定进行什么样的处罚及处罚金额,这样比较麻烦和容易出错。我们可以用产生式规则解决税务稽查中的违法定性和处罚,即:将《税收征管法》整理成规则库,通过对规则的匹配和推理,得出定性处罚结论。
①范年茂、郭 冰《电子商务对税务稽查的挑战》,《税收与企业》2003年第8期。
②宋兴彬、徐 力《数据挖掘技术在税务系统中的应用》,《山东电子》2001年第2期。③闫建红《基于产生式规则的税务稽查系统的研究》,太原理工大学硕士论文2004年。
上一篇:跑跑卡丁车新手教程评测