打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
什么是税务稽查中的“网络爬虫”?


2017-03-22 中税书店
一、“网络爬虫”解读
“网络爬虫”也称“网页蜘蛛”,是一个自动提取网页的程序,运用“网络爬虫”技术设定程序,可以根据既定的目标更加精准选择抓取相关的网页信息,有助于在互联网海量信息中快捷获取有用的涉税信息。
二、“网络爬虫”运用
“网络爬虫”技术主导下的涉税信息监控平台具有三个突出的特点:分类抓取、实时监控和智能比对。平台主要从证券财经网站,重点抓取上市公司公告、上市公司十大股东股票减持、限售股解禁等信息;风控中心的专用电脑全天候实时抓取、储存和分类整理相关信息;平台将从互联网获取的信息与税收征管系统以及其他第三方信息进行自动比对,从中筛选出存在税收风险的管征户信息。
三、“网络爬虫”流程
进入系统后,先连接互联网的风控中心电脑,通过“网络爬虫”程序定向抓取各网站上发布的上市公司公告信息,并且将这些信息转化成可识别的文本。在当天股市收盘后,扫描程序开始启动,扫描“网络爬虫”抓取的公告内容。如果扫描中出现了国税局管理的企业名称或者是其他有效信息,监控平台会自动将公告与国税局管理企业建立起关联,并且以不同颜色的字体和高亮方式显示在电脑屏幕上。风控中心人员可以实时看到关联信息。
四、“网络爬虫”延伸
现在国地税协作,大数据将共享,利用“网络爬虫”原理调用百度、搜狗等知名搜索引擎的接口,获取其他方面诸如实际关联公司、经济案件的法院判决结果等信息数据,是轻而易举的事儿。以后,还将积极探索采集外语信息,将境外上市公司纳入监控范围,不断拓展"互联网+"应用领域,进一步提升税收征管水平。
附案例1:百度地图被引入税务稽查
天津市国税局引入林业部门提供的第三方参考数据,按照草皮、各种类苗木的指导价格区间、单亩种植的承载能力、成熟周期,推算发票用量及累计最大开票额度,从而有效防范企业随意开具发票,销售非自产的免税农产品等情况。
天津市国税局利用百度地图标记企业种植使用地块位置,并将标记地块位置与乡镇土地规划部门和企业实际签订合同比对。由于标记地块位置具有唯一性,避免了虚假合同造成的地块重复。
附案例2:互联网+税务已经深入税务稽查
某市税务机关利用税务大信息平台,将银行房屋贷款按揭的数据与房地产开发公司申报纳税的销售(预售)收入数据进行比对,其涉税违法行为立刻现形,该房地产公司由于涉税数额巨大,公司相关责任人均被立案处理。
总结:
通过大信息平台,税务将与与网络运营商、认证中心、工商、财政、公安、海关、金融机构、外汇管理、国土规划和物流中心等有关部门实现信息互通、数据互联、资源共享,不断充实、持续扩展、实时更新纳税人信息库,便于稽查比对发现税收疑点!
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
税务稽查用上了这些新手段!你一定得看看…
税务稽查新手段:“爬虫”技术!2015老板、财务必须了解!
教你一招:如何用“互联网+”提升稽查效能
十堰国税:风险防控借力“互联网+”
“网络爬虫”“百度地图”……税局查税招式越来越多啦
税务稽查中提到的“网络爬虫”技术是什么?怎么“爬”?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服