【摘要】大力推进领导干部自然资源资产离任审计信息化建设,积极探索该领域的大数据审计模式,构建数据分析平台,实现资料、数据、思路、模型的共享,对于推广领导干部自然资源资产离任审计先进分析思路和审计方法,提高审计工作质量和效率具有重要的意义,并可为对领导干部作出更准确的总体评价提供更好支撑。本文对构建领导干部自然资源资产离任审计数据分析平台的实践基础、目标和原则进行了分析,提出该平台包括资料库、数据库、思路库、模型库和结果库五大模块,并对当前平台建设存在的挑战及建议进行了探讨。
2017年9月,中办、国办印发《领导干部自然资源资产离任审计规定(试行)》,标志着领导干部自然资源资产离任审计由试点进入到全面推开阶段,向制度化、规范化迈出了坚实的一步。2017年12月,胡泽君审计长在全国审计机关贯彻落实领导干部自然资源资产离任审计规定(试行)视频会议上指出,要大力推进资源环境审计信息化建设,积极探索大数据审计模式,提高资源环境审计数据综合利用水平,提高审计工作效能和水平,对资源环境审计信息化建设提出了明确要求。领导干部自然资源资产离任审计具有专业性强、覆盖面广、涉及资源类型多、审计评价难度大等特点,借助大数据技术,构建数据分析平台,加大自然资源资产和生态环境领域地理信息数据和相关业务、财务等数据的收集,灵活运用测绘遥感、自动监测、多维分析等技术方法,对相关数据开展日常分析和依托审计项目开展专项分析,可以提高审计工作效率、质量和深度,同时为对领导干部作出更准确的总体评价提供更好支撑。
本文对构建领导干部自然资源资产离任审计数据分析平台(与审计业务相关部分,不包括平台基础设施架构)进行了探讨,提出建立资料库、数据库、思路库、模型库和结果库,以在审计工作中大力开展数据分析,积极贯彻“总体分析、发现疑点、分散核实、系统研究”的大数据审计模式。
一、领导干部自然资源资产离任审计数据分析平台构建的实践基础
(一)近几年领导干部自然资源资产离任审计大数据应用总体情况。
在署2018年度大数据审计研讨班上,自然资源和生态环境审计司基于全国层面的调研,对近年来领导干部自然资源资产离任审计大数据应用总体情况作了介绍。从调研结果看,在署党组“向信息化要资源、向大数据要效率”“加强顶层设计”“数据先行、以用为本”“强化大数据审计思维”等指示要求下,各级审计机关从领导干部自然资源资产离任审计的数据特点出发,结合当地具体情况,积极探索运用大数据技术来提升资源环境审计效能,并取得了一定成效。
一是数据资源积累等基础工作广泛开展。从省、市两级审计机关统计分析看,半数以上的审计机关开展了数据采集工作,涉及自然资源等10余个政府主管部门的信息系统;数据管理也在逐步走向规范化、常态化,其中有近一半进行了数据整理,五分之一实现了数据定期报送。如,山东省审计厅已采集土地、矿产等多个领域多种类型的地理空间矢量数据,并完成了数据格式转换、坐标系变换及脱密处理。广州市审计局通过开展自然资源资产情况专项审计调查,摸清了自然资源相关主管部门的数据存储情况,并逐步建立了数据定期报送制度。
二是大数据应用取得了初步审计成效。省、市两级审计机关中,有70%的审计机关应用SQL、ArcGIS等分析技术开展了数据分析工作,有些问题通过数据分析发现并最终纳入审计报告(审计意见),涉及多个资源环境审计项目,问题类型涵盖土地、森林等多个资源环境领域。如,枣庄市审计局探索运用地理信息技术方法,仅在实施的某市领导干部自然资源资产离任审计一个项目中,所揭示问题就占发现问题总数的40%。一些地方审计机关主动作为,探索开发了有针对性和有特色的资源环境审计数据分析软件。如,四川厅、云南厅、湖北厅、福建厅等审计厅探索开发了领导干部自然资源资产离任审计数据分析平台,实现了项目管理、数据归集、对比分析、疑点筛查、可视化展示等功能。
三是大数据应用在各地发展不平衡。从近3年组织实施的领导干部自然资源资产离任审计项目看,部分审计机关建立了专门的数据分析团队,制定了专项数据分析方案,并通过政府购买服务、签订战略合作协议等方式,与地理测绘、规划设计等专业部门和高等院校建立了常态化合作机制。如,浙江省审计厅与省测绘局、浙江大学建立了战略合作机制,通过共同开展研究课题、共同打造数据分析平台等方式,实现审计业务和技术服务双赢。但还有相当数量的审计机关大数据应用还不够充分,存在尚未设立资源环境审计数据分析团队,尚未配备分析设备,在开展审计项目时未制定数据分析方案,尚未利用存储的资源实现数据先行等问题。
(二)审计实践对领导干部自然资源资产离任审计数据分析平台构建的要求。
对当前审计机关在领导干部自然资源资产离任审计中数据应用情况、平台建设需求进行分析,领导干部自然资源资产离任审计数据分析平台,需要实现集中存储管理工作中的相关数据,收集整理相关领域的法规政策,将成熟的数据分析思路固化为审计模型,对审计结果进行归纳汇总,应具有高安全性、灵活接入性和可扩展性的特点,实现数据多维查询、总体分析和疑点分析等功能。重点体现以下几方面的实践要求。
一是需要实现领导干部自然资源资产离任审计中的资料、数据、思路、模型共享。数据分析平台应实现对领导干部自然资源资产离任审计相关领域全范围总量数据、相关政策法规、审计系统内数据分析思路、成熟分析模型的整合,实现数据、资料、思路、模型的共享。审计人员根据权限登录平台,可以进行资料查询、数据查询、分析思路查询、分析模型调用和审计结果查看等操作,以节约收集资料、数据、设计分析算法等工作时间,有效缓解审计时间紧、任务重、人手不足的困境,提高审计工作效率。
二是需要提高审计发现问题的广度和深度,对领导干部履行自然资源资产管理和生态环境保护责任情况作出更准确的总体评价提供更好支撑。领导干部自然资源资产离任审计需要对被审计领导干部履行自然资源资产管理和生态环境保护责任情况进行总体评价。当前影响总体评价的因素主要有两点,一是由于各地区自然禀赋的差异,确定科学合理的评价指标体系存在困难;二是准确的总体评价需对领导干部进行全方位、全覆盖、全要素的审计,该要求涉及较多相关部门的数据,对数据的全面性、准确性、标准性,以及审计人员的数据分析水平等要求较高,而当前数据质量和审计人员水平均存在不足。如林业部门提供森林覆盖率数据及领导干部任期内该数据的变化情况,但数据准确性如何?数据变化是好是坏?是什么原因导致的?这些问题的判定均存在难度。
因此针对数据质量、数据分析的局限性,体现在平台的建设要求上,需在平台将各领域相关数据进行统一汇集、标准化、管理共享的基础之上,实现对跨行业、跨领域、跨时间的数据进行碰撞分析,多方印证,对较全范围的数据,从更多角度、更全面、更深入挖掘问题,提高审计发现问题的广度和深度,确保问题的覆盖面,并全面客观分析问题产生的原因,为对领导干部作出更准确的总体评价提供更好支撑。
三是能够对领导干部自然资源资产离任审计领域的总体数据进行分析,发现体制机制方面的问题,提出有效建议。平台数据库中的数据应是在全口径上对相关数据的整合,通过对数据的不断积累,审计数据分析人员可以不局限于审计项目,采用关联分析、趋势分析等方法,对多来源的相关数据开展日常跟踪式的总体分析,及时发现政策执行中存在的问题或违纪违法线索,通过进一步分析或延伸调查取证,查实问题,分析原因,提出有效的可行性建议,从而健全完善体制机制。
二、领导干部自然资源资产离任审计数据分析平台构建的目标和原则
数据分析平台以实现资源环境相关数据、资料的集中安全存储管理、数据的共享和综合分析利用为目标,为审计人员提供高效的数据查询、数据分析思路和模型共享等功能。平台建设中要遵循高安全性、灵活接入性和可扩展性的原则。
(一)平台构建目标。
(1)实现审计系统内数据的共享。
平台需要对来自不同部门、不同领域资源环境方面的数据和资料进行整合,审计人员在权限范围内,可以查询数据、资料,或对来源各异、种类不一的各类数据进行碰撞分析,打破审计工作中的信息孤岛,实现数据的共享和应用。
(2)建立安全高效的数据采集和存储机制。
平台构建中需研制各类数据的适配接口,对接各被审计单位信息系统获取的各类异构数据,并采用大数据主流框架和技术对数据进行存储管理,实现统一安全高效存储,为数据的挖掘和分析打好基础。
(3)实现数据分析与决策。
平台需将审计工作中所采用的关联分析、趋势分析、地理信息技术分析等相关技术,固化成数据分析模型,审计人员通过调用模型可提取数据中隐含的、未知的、极具潜在应用价值的信息和规律,以发现领导干部自然资源资产离任审计中的重大违纪违法问题线索,反映影响人民群众利益的资源环境问题,揭示资源环境领域体制机制方面的问题,并深入分析问题产生的原因,提出科学的可行性建议。
(二)平台构建原则。
(1)安全性。
资源环境领域的数据涉及部门广,数据种类多,数据中隐含的信息量大,对数据进行关联分析价值大,因此数据分析平台建设中要充分重视平台自身的安全性,应采取安全性高的访问认证机制和数据存储管理机制。
(2)灵活性。
平台数据采集的主要方式之一是接入被审计单位的信息系统进行采集,因此在平台的设计和实施中要考虑与其他部门信息系统的对接,根据审计工作中对数据结构的需求,开发多个类型的标准化数据采集接口,能够灵活接入被审计单位相应的信息系统,以及时有效采集数据。
(3)可扩展性。
数据分析平台的建设是一项长期持久的工作,随着领导干部自然资源资产离任审计工作的推进,对于审计工作中典型的、成熟的、可推广的数据分析思路、数据分析模型,要及时地添加到数据分析平台中,因此平台的规模和要求会不断变化,平台的设计和实施要具有良好的可扩展性,以满足审计业务不断发展的需要。
三、领导干部自然资源资产离任审计数据分析平台的功能和内容
(一)平台功能。
(1)查询功能。
实现对自然资源资产的基本信息、资金征管用信息、建设项目信息、相关法律法规政策、资源环境专业知识、项目相关审计分析思路、审计结果等的查询及可视化展示。如:山水林田湖草等自然资源总量查询、审批文件查询、审计结果查询。查询形式上满足按部门来源、地域、资源环境种类的多维度查询。实现信息的单个查询、批量查询,以及相关信息的关联查询,如查询某资环项目负责单位,可将相关的工商信息、税务信息、财政资金信息、文件审批信息、行政处理处罚信息等均查询出来。
(2)总体分析功能。
总体分析主要是对面上数据做统计分析、关联分析、趋势分析等,通过调用模型库中的总体分析模块,发现政策执行中体制机制方面存在的问题,防范风险的产生。如通过调用绿色金融政策分析模块,发现银行发放贷款给污染严重企业的问题,调用固体废弃物分析模块,发现企业违规倒卖固体废弃物进口许可证等问题,深入分析这两类问题,发现部门之间数据共享存在较大壁垒,不能有效利用数据关联分析发现违规问题,进而可提出加强部门间数据共享和协同工作的建议。
(3)疑点分析功能。
疑点分析主要侧重于揭示违规问题,服务于审计报告内容。通过导入数据库中相关数据,调用模型库中的数据分析模块,对资金征管用、政策执行、项目建设等问题的可视化分析、比较分析、关联分析、图斑分析、文本分析等,发现疑点问题。如调用自然资源资产基础数据的统计分析模块,得出自然资源资产实物量变化情况;调用工商、税务和在线监测等数据分析模块,核查环境污染问题;调用公益林图斑、基本农田图斑与地理国情地表覆盖数据叠加对比分析模块,发现自然资源被非法占用的问题等。
(二)平台内容。
数据分析平台主要包括资料库、数据库、思路库、模型库和结果库五大模块。如图所示:
(1)资料库。
资料库主要包括:a.生态文明建设相关法律法规,党和国家领导人关于生态文明建设的系列重要讲话精神,中央关于生态文明体制改革的决策部署以及相关重大政策措施;b.部门及地方政府制定的生态文明建设相关规章制度、配套文件;c. 资源环境领域的专业知识、技术标准等资料文件。
这些资料主要为数据分析提供理论政策支持,是确定数据分析要点,确保数据分析选题紧贴实际、紧扣社会热点的重要信息。资料收集应及时、全面,注重积累,存储应做好分类,便于查询和分析。
(2)数据库。
数据库用于存储领导干部自然资源资产离任审计的数据资源,可分为业务管理类数据库、客观实物类数据库和媒体类数据库。其中业务管理类数据库主要包括发展改革部门、财政部门、工商部门、税务部门、海关部门、生态环境部门、自然资源部门、水利部门、农业农村部门等的财务数据、业务数据和管理数据,如任务指标数、审批文件、专项财政资金数据、监测数据、水土林田湖草等自然资源资产的底数、实物量等基础数据;客观实物类数据库主要包括与地理信息相关的数据,如卫星遥感影像数据、土地利用规划图、生态保护红线矢量数据、土地类型图斑数据、地理国情普查数据等;媒体类数据库主要是从互联网上爬取或与媒体机构共享的相关数据,如资源环境方面的重大损毁事件报道、资源环境方面的违规违法处理处罚等。
(3)思路库。
思路库主要收集存储审计人员的数据分析思路。这些分析思路可按方针政策和决策部署情况、遵守相关法律法规情况、重大决策情况、完成目标情况、相关资金征管用和项目建设情况等审计内容进行分类。
数据分析思路可以是审计人员在具体项目开展过程中,针对具体审计业务工作所产生和积累的,也可以是数据分析人员根据对相关政策、法律法规的把握,对审计业务的认知,对相关数据的理解,以及互联网上的违规违纪信息,对数据进行分析所得出来的。数据分析思路包括:问题名称、问题所属方面、问题所属领域、涉及数据、数据来源、相关法律法规政策、分析步骤等。思路库中的数据分析思路成熟后,将被开发成数据分析模型纳入模型库中。
(4)模型库。
模型库是可直接调用的数据分析模型集,这些模型是通过编写程序或选择合适的数据分析应用工具,对成熟的数据分析思路所进行的开发和固化。模型库是动态更新可扩展的,随着审计人员数据分析能力的提升、相关问题的不断整改,模型库中会不断增加新的分析模型,并淘汰落后的分析模型。
按数据分析技术可以将模型分为:a.关联分析模型,如专项资金的合法性分析;b.地理信息技术分析模型,如运用3S技术对相关资源图斑的比对分析;c.可视化分析模型,如资金流向的可视化分析、排污口位置的可视化分析等;d.文本分析模型,如对政策热点问题的分析;e.关系网络分析模型,如招投标企业关系分析等。
按问题类型可以将模型分为:a.政策执行问题分析模型;b.重大决策分析模型;c.资金征管用问题分析模型;d.项目建设情况分析模型等。
(5)结果库。
结果库主要反映运用数据分析查实的问题及结果,如审计报告中的问题、针对问题提出的体制机制建议等。这些审计结果一方面可为相关审计项目提供参考资料,另一方面,随着结果库的不断积累,对不同问题、产生原因等进行分析,可为审计工作方案的制定、审计项目重点内容的选择等提供参考。
四、领导干部自然资源资产离任审计数据分析平台构建的挑战及建议
(一)平台构建的挑战。
随着领导干部自然资源资产离任审计的全面铺开,审计人员在工作过程中会产生和积累一定的数据分析思路,为平台的构建提供支撑,但在平台构建中仍有较多的挑战。
(1)数据入库要求难以达到。
平台数据库的入库数据应具有全面性、时效性和标准性。而由于领导干部自然资源资产离任审计实践较少,审计人员对所需数据、审计业务了解不足,难以比较准确地判断数据采集范围,导致无法全面及时采集所需数据。此外,所采数据来源不同、类型不同、格式各异,按审计业务数据分析的要求对数据进行标准化处理是一项耗时较长、技术水平要求较高的工作。此外,对于含有地理信息的数据由于保密要求,在采集中也存在一定困难。因此,采集全面、时效性的数据,并对数据做标准化处理具有一定挑战。
(2)文本数据分析实践较少。
领导干部自然资源资产离任审计需较多关注领导干部对生态文明体制改革相关任务推进落实情况、贯彻执行中央生态文明建设方针政策和决策部署情况、资源环境方面重大决策情况等,这些情况的审计较多涉及工作报告、会议纪要、出台制度、收发文记录等非结构化文本数据,而当前审计工作数据分析主要针对的是结构化数据,对文本数据分析实践经验较少。因此,探索文本数据挖掘技术,充实平台文本数据分析模型具有一定挑战。
(3)审计人员专业数据分析能力不足。
与其他领域审计业务数据分析相比,领导干部自然资源资产离任审计会涉及较多的矢量、图像数据,如卫星遥感影像数据、土地利用规划图、生态保护红线矢量数据、土地类型图斑数据等,审计人员需加强对地理信息、遥感等专业知识、专业技术的学习,以满足对这类数据分析的要求。
(4)平台初始及后期扩展需要有人力保障。
数据分析平台的基础设施架构等可以由第三方软件公司开发,但是数据平台资料库、数据库、思路库、模型库、结果库的初始及后期扩展需要有足够的人力保障,如收集政策法规、收集审计人员的数据分析思路,筛选有代表性的数据分析思路进入思路库、筛选成熟分析思路开发为模型,以及跟踪审计业务开展中的创新数据分析思路等,都需要有足够的人力保障。
(二)平台构建的建议。
针对本文所提出的平台内容及当前面临的挑战,提出如下建议,以做好平台建设前期准备工作:
(1)建立资料、数据收集机制。
加强收集整理积累生态文明建设法律法规,党和国家领导人关于生态文明建设的讲话、各部门和地方政府制定的规章制度和配套文件,资源环境专业知识等,建立资料目录清单及自动更新整理机制。
依托审计项目,梳理相关部门信息系统数据,了解数据类型、数据之间关系,根据审计业务需要,制定数据采集清单和数据标准。与相关媒体建立信息共享机制,做好数据资源索引目录,建立数据收集工作机制。对于无法采集的数据,如包含地理位置信息的数据,应与相关部门建立工作合作机制,根据审计项目需要,聘请专业部门提供数据和技术支持。
(2)建立数据分析思路创新、模型开发机制。
调研审计署业务司局、驻地方特派员办事处、地方审计机关在资源环境审计、领导干部自然资源资产离任审计中的数据分析思路、分析结果等,将典型思路放入思路库,借助第三方将成熟做法固化为模型。培养审计人员用数据分析支撑审计问题的思维,不断创新数据分析思路,开发数据分析模型。
(3)建立人才储备机制。
与科研院所、智库机构建立联系,为平台储备国家政策解读、资源环境专业知识咨询人才。加强审计人员在数据标准化处理、数据爬取、文本分析、地理信息数据分析等方面的培训,建立资源环境审计数据分析人才储备。
参考文献
[1]刘荣莉,王敏.2017.大数据背景下的审计监督体系平台构建研究[J].中国审计评论(1):88-95.
[2]梁曼莉,王铭.2018.地理信息技术在自然资源资产离任审计中的应用[J].现代审计与经济(2):35-37,
[3]王强,李俊杰,陈小军,等.2016.大数据分析平台建设与应用综述[J].集成技术(5):2-18.
[4]王子怡,冯小妹,许锐敏,严梦.2017.领导干部自然资源资产离任审计的难点与对策研究[J].财会研究(3):59-63.
[5]刘星,牛艳芳,唐志豪.2016.关于推进大数据审计工作的几点思考[J].审计研究(5):5-9.
[6]刘国城,王会金.2017.大数据审计平台构建研究[J],审计研究(5):36-42.
[7]孙雪娟.2017.基于信息分析视角下的大数据分析平台构架研究[J].信息通信(11):101-103.
[8]李巍巍.2016.基于云计算的大数据统一分析平台设计与应用[J].自动化与仪器仪表(8):195-197.
(转载自:审计署 http://www.audit.gov.cn/n6/n39/n62/c131084/content.html)
扫一扫在手机上查看当前页面