第一节 税收大数据获取概述
一、税收大数据获取的意义
根据税收大数据治理的目标任务,采用科学的税收大数据获取技术手段和方法,有组织、有计划地对涉税经济活动的信息数据进行采集和调查,全面系统地了解、掌控涉税经济活动的数量、状况及税收风险的特点、规律,为有效开展税收大数据分析提供丰富的、系统全面的、高质量的税收大数据资源。
税收大数据有两种:一种是未经过任何加工整理的原始数据,通常是混杂的,又称为初级的第一手资料,包括海量的非结构化和结构化数据;另一种是次级资料,也称为间接数据,是指经过加工整理的涉税信息数据,在一定程度上进行了分类归集,加工汇总,能初步反映和说明涉税经营活动数量特征及申报纳税的基本情况,所有的次级资料都是由原始资料加工、处理、汇总而来的。
二、加强税收大数据获取的措施
(1)拓展税收大数据获取来源和渠道,及时、完整、准确地获取税务端纳税缴费登记、申报信息、发票、征收管理及纳税人端生产经营全过程的涉税信息数据。
(2)加强与市场监督、自然资源、统计、公安、海关、银行等部门及其他第三方涉税数据的获取、共享及有效集成利用。
(3)做好企业集团生产经营、涉税信息的常规性获取管理工作。
(4)通过逐步推广数字货币、区块链、电子发票系统的应用领域,最大限度地获取、共享基于真实交易的税收大数据。
(5)做好跨地区经营纳税企业涉税汇总信息数据的获取、交换与共享工作。
(6)拓展国际税收情报交换的范围,采取灵活多样的税收情报交换形式,完善国际税收情报交换机制及管理工作。
(7)加强税收大数据清洗、审核、存储、处理、交换、共享及系统集成,有效提高税收大数据精准性。
三、税收大数据的获取渠道和内容
(一)内部数据的获取渠道和内容
1.渠道来源
税务机关内部的税收大数据,主要包括税务登记数据、各类认定数据、增值税发票系统大数据、纳税申报征收系统数据、收入规划核算数据、金税工程核心征管系统数据等。
2.获取内容
(1)金税系统“一户式”“一人式”存储的各类纳税缴费信息资料,主要有税务登记的基础信息,包括纳税人缴费人名称、登记注册类型、开办日期、注册地址、生产经营地址、核算方式、从业人数、单位性质、门户网站网址、适用的会计制度、经营范围、法定代表人、财务负责人、办税人、注册资本或投资总额、投资方信息、投资结构、总机构信息、分支机构信息等;各项核定、认定、优惠减免、缓抵退税审批事项结果的相关信息。
(2)增值税发票信息,包括来自金税系统增值税交叉稽核系统、电子底账系统、大数据云平台的各类发票所记载的货物和服务的交易对象、品名、价格、金额、流向等涉税信息及上下游交叉比对结果信息。
(3)其他专项调查和调研信息如税收管理员的日常巡查数据、专项调查分析数据及调研分析报告。
(4)纳税风险评估和税务稽查历史查补入库数据,包括通过大要案、案件司法认定结果、专项检查、涉外审计等获取的补充信息和处理信息。
(5)税务行政处罚信息、纳税信用状况及评定信息。
(6)通过国际税收协定情报交换机制取得的信息数据。
(7)纳税缴费申报信息数据,财务会计报表数据,以及税务机关依据职权要求纳税人缴费人提供的附报、补充申报等相关涉税资料。纳税缴费申报信息数据主要包括计税计费依据、计税销售收入,计税营业收入,减、免、退税涉及的收入,产品产、销、出口量,应纳税额,减、免、退税额,入库税额,期初未交税额等;财务会计报表数据包括利润表指标数据,如主营业务收入、主营业务成本、主营业务税金及附加、销售费用、管理费用、财务费用、利润总额等;资产负债表数据指标,如资产合计、负债合计、固定资产净值平均余额、流动资产平均余额、折旧等。
(8)其他统计数据指标,包括工业总产值、增加值、工业中间投入、中间投入中直接材料、全部从业人员劳动报酬、工业销售产值、产成品、从业职工人员等。
(二)外部数据的获取渠道和内容
国家税务总局先后下发了《国家税务总局关于印发税收数据标准化与质量管理办法的通知》(税总发〔2016〕97号)、《国家税务总局关于建设金税三期数据管理体系的指导意见》(税总发〔2017〕71号)等多个文件,提出各级税务机关应加强数据共享,逐步拓展数据共享范围,做到一方采集,共同使用,鼓励各级税务部门积极与第三方开展数据共享,构建第三方数据共享平台,为税收工作有效开展提供第三方数据支持,为外部信息数据获取工作提供了政策支撑。2021年3月24日,中共中央办公厅、国务院办公厅印发的《意见》提出:“2025年建成税务部门与相关部门常态化、制度化数据共享协调机制,依法保障涉税涉费必要信息获取。”
税务系统外部涉税大数据的获取渠道和内容主要包括两个方面。
1.涉税生产经营信息数据的获取
又称第二方信息数据的获取,构建与企业商业管理模式相匹配的企业ERP信息采集、共享平台,同时结合专项调查和深入生产经营实地调研,对纳税人缴费人生产经营的实际情况进行深入了解和调查。如交通物流企业实际拥有的运输车辆、载重量等。获取和掌控涉税生产经营的实际情况及税收风险特征数据。第二方信息数据主要是涉税生产经营全过程的真实数据,非申报数据或第一手原始数据。具体内容包括:
(1)所属行业经营发展情况,行业景气指数及周期变动情况,企业长、中、短期发展战略、组织架构及年度内部控制指标等信息数据。
(2)涉税生产经营指标等大数据,包括生产经营特点、工艺流程的技术特点、主营业务及相关产成品、副产品及其构成等;原材料采购、供应、库存情况;物耗、能耗及结构特点;设备、包装物等生产特色等;存货、销售合同、运输方式、分销渠道、销售终端及售后服务等静态和动态的涉税大数据。
(3)企业实际财务核算状况。企业生产经营的基本情况,利润实现、分配及企业盈利或亏损情况。
(4)企业自身自设门户网站网页的涉税信息数据。
2.第三方涉税信息数据的获取
第三方涉税信息数据是来自征纳双方之外的涉税大数据。第三方涉税信息范围广泛,来源渠道较多,其主要渠道包括政府行政、事业机构、行业管理部门及业务往来单位的涉税数据。第三方涉税信息数据的获取应用需要得到信息所有者和提供者的认可、支持和配合,并在一定的保密原则下交互使用。主要内容包括以下方面:
(1)政府部门及行业主管部门门户网站的涉税信息数据,包括市场监管、统计、商务、自然资源、发改委、城建、土管、房管、证监、银监、保监、海关、银行、纪委、司法等各部门主体的涉税大数据。
(2)行业协会信息。互联网时代,很多行业协会通过网站公布行业的供需信息、行业技术、法律法规、行业发展等有关信息。如通过煤炭行业协会、纺织行业协会相关网站获取行业的发展报告信息,行业经济和技术指标数据等。
(3)互联网第三方交易平台交易数据,主要是指第三方电子商务交易平台记录的交易和服务的涉税信息数据,如天猫、淘宝、京东、美团外卖等交易平台记录和显示的交易数据,延伸拓展至手机端App的微信、支付宝交易信息和数据。
(4)会计师事务所、税务师事务所提供的涉税服务信息数据。
(5)研究机构专题研究报告信息,如专业的证券公司、投资公司的行业分析研究报告。
(6)社会支持信息,包括媒体、举报、社会热点信息以及以资源、能源消耗为重要特征的来源信息,如电力、水力、矿产等的消耗数据。
(7)宏观经济调控及相关政策信息,近期的宏观经济调控政策及热点问题相关信息数据。
(8)互联网开放平台及手机App涉税信息。相关门户网站及手机App涉税大数据,如“巨潮”“东方财富网”资讯平台上市公司公告信息、限售股解禁涉税信息,“千里马招标网”“天眼查”“企查查”“货拉拉”“启信宝”“安居客”“土流网”等网站平台的涉税大数据。