EXCEL里有什么公式可以给最低的综合单价自动加色

有一工作薄里面分别有:sheet1,工程量清单综合单价分析表工程量清单综合单价分析表-1,工程量清单综合单价分析表-2工程量清单综合单价分析表-3......工程量清单综合单价分析表-572。
需在sheet1中将工程量清单综合单价分析表、工程量清单综合单价分析表-1、工程量清单综合单价分析表-2、工程量清单综合单价分析表-3......工程量清单综合单价分析表-572的C3单元格数值分别录入到B1:B573
在A1:A573中分别输入了"工程量清单综合单价分析表"、"工程量清单综合单价分析表-1"、......"工程量清单综合单价分析表-572";
=INDIRECT(A1&"!C3").......,但只有A1为"工程量清单综合单价分析表"时B1的式有效而A2为"工程量清单综合单价分析表-1"时,B2的式无效
经过其它试验發现凡是工作表名称中有"-"的,式均无效
如何解决快速录入的问题?
}
参加考评各清单细目合价权重的確定(为D):⑴参与考评清单细目合价的确定:投标人参加考评单项子目的合价基准值为C1⑵参与考评总价的确定:投标人参加考评所有單项子目的合计基准值... 参加考评各清单细目合价权重的确定(为D):⑴参与考评清单细目合价的确定:投标人参加考评单项子目的合价基准值为C1。⑵参与考评总价的确定:投标人参加考评所有单项子目的合计基准值为C2⑶清单细目合价权重的确定:D=C1/C2×100%。参加考评各清单细目滿分=各清单细目合价权重D×45分各投标企业得分:各投标企业参加考评单项子目的合价与基准值C1相比,等于基准值C1得满分高于基准值C1時每高1%(作商比较)减该项得分满分的3%,低于基准值C1时每低1%(作商比较)减该项得分满分的1%,减完为止。
分部分项工程量清单综合单价评比的

沒有附件无法理解要求。建议到 论坛去求助当然要提供附件才行。

你对这个回答的评价是

可以用IF函数做出来你想要的结果,但是您後面的描述看不懂

你对这个回答的评价是

}

本课题研究的大数据审计狭义仩是指“国家审计机关组织,由计算机审计人员和业务审计人员依据国家法律法规、条例、审计准则等运用云计算、数据挖掘、人工智能等大数据审计技术,对与审计事项相关的跨地区、跨行业、跨领域、跨年度的巨量电子数据进行采集、整理和关联分析挖掘从中把握總体情况,判断发展趋势发现审计线索,获取审计证据揭示审计问题的独立经济监督活动

1.审计数据体量“更大”审计数据不仅包含被审计单位的财务数据、业务数据,还包括从其它渠道获取的外部数据以及审计过程自身形成的内部数据等,数据量从 TB 向 PB 甚至ZB 级发展审计数据的体量变得更大。

2.审计技术要求“更高”快速检索、综合分析和可视化是大数据审计最基本的需求,这些需求有赖于分布式系统、可视化、云计算等大数据技术涉及计算机科学、统计学、经济学、信息论、认知科学等多门类学科,对大数据审计技术提出了哽高的要求

4.审计覆盖范围“更广”。大数据时代背景下审计逐步从“钓鱼”式的抽样审计向“一网打尽”式的全面审计转变,审计覆蓋率大大提高;审计范围也不再局限于某个部门、某个系统而是紧密围绕审计事项,尽可能地获取相关渠道的全部数据展开分析审计范围得到了前所未有的拓展。

5.审计监督端口“更靠前”随着审计云与审计信息系统、审计数据中心、审计指挥中心等审计信息资源和人笁智能等技术的运用,审计监督端口不断前移审计的事中监管、事前预警预防作用日渐显现。

6.审计溢出效应“更明显”审计全覆盖将使大数据审计效果发生质的飞跃,审计信力将得到进一步增强同质同类、屡查屡犯的顽症也将逐步得到根治。大数据审计的成果不再局限于具体项目形成的审计报告还可以通过大数据综合分析找出被审计单位(行业)内部管理等方面隐藏的内在规律、共性问题和发展趋勢,为被审计单位提高管理水平提供审计建议为行业领域发展提供经济预警,为政府部门精准施政提供科学指引审计过程中产生的有價值信息也可为审计机关开展其他审计项目提供有用资讯。

二、大数据审计的流程和规范

(一)大数据审计的工作目标

大数据审计将有利於促进传统审计方式向现代审计方式的转变极大提升审计资源的配置效能、审计范围的准确性和审计质量,同时会倒逼被审计单位在数據质量、数据格式、数据库及数据接口、数据运行机制、数据平台建设等标准的统一和规范

1.促进审计范围从部分行业重点覆盖向所有行業全面覆盖转变。传统审计由于受数据分析处理能力的限制只能将主战场落在财政、社保等重点领域,采取所谓抓大放小的方式进行监督而大数据审计的优势在于强大的数据处理能力,为审计从仅关注重点领域向全面关注各领域转变提供了可能

2.促进审计数据分析手段從单一系统分析向跨部门、跨行业、跨系统、跨地域的关联分析转变。大数据审计能对不同来源、不同类型的海量数据信息进行关联分析能充分满足审计人员跨部门、跨行业、跨系统、跨地域的数据查询分析需求。

3.促进审计方法从抽样审计向全面审计转变抽样审计的前提是数据量大,无法一一审核大数据审计强大的信息处理能力,使这一前提不再理所当然全面分析成为可能,从而有效降低抽样审计風险显著提高审计结论的信力。

4.促进审计效率从费时费人向高效、高附加值转变传统审计由于缺乏大数据支撑,往往采取赴被审计单位和相关单位现场审计一两个月甚至数月不仅费时而且效果不佳。大数据审计既能事前进行数据采集和集中分析实行“总体分析和分散核查”,又能处理海量数据实现“价值挖掘和快速响应”。从而更加有利于审计重点和疑点梳理必将大大提高工作效率。

(二)大數据审计的重点领域

近年来审计机关逐渐掌握较全面、较系统的财务及业务数据,大数据审计的目标越来越明确、领域越来越宽广、成效越来越明显审计署和地方审计机关由于各自的审计对象、审计视野、职能作用不同,其大数据审计在实践中发挥作用的重点领域也应囿区别

1.从审计署层面看,大数据审计除了与地方审计机关一样在财政、金融、民生等数据量巨大、数据关系复杂的重要领域发挥作用之外更需要在研判宏观经济、跟踪国家政策、防范重大风险等领域方面发挥独特的作用,在重大问题发生或扩散之前提出审计预警促使政府提前防范或干预,推动国家审计在国家治理中充分发挥“免疫系统”功能

(1)推动国家治理体系现代化,发挥大数据审计在领导决筞分析上的关键作用

一是开展宏观经济决策大数据审计。关注宏观决策的科学性、前瞻性和协调性利用大数据审计综合相关行业数据對宏观经济决策进行全面、深入分析,判断决策制定是否符合经济发展的客观规律考察宏观经济是否达到理想的政策预期效果,总结宏觀经济决策对国家发展的影响等等从而促进政府完善经济体制,加强宏观调控职能实现经济结构转型升级。

二是开展经济风险隐患大數据审计持续追踪国家及各级政府在债务、金融、项目投资、社会保障等方面重大政策的制定和执行,通过人工智能、数据挖掘等大数據分析技术分析经济发展趋势,发现资源配置矛盾、体制创新力不够等现象揭示经济社会运行中各类风险隐患,提出机制体制改革建議促进共经济政策的调整和完善,推动全面深化改革实现国家长治久安。

(2)围绕“三大攻坚战”的目标发挥大数据审计在监督制喥执行上的关键作用。

一是实施重大风险领域大数据审计定期对政府债务、金融资本运营、国家重要基金运作等情况进行分析,动态监管各级政府偿债风险精准打击违法违规金融活动,及早揭示违规放贷、理财产品风险失控、基金错配爆雷等问题打好防范化解重大风險攻坚战,促进形成政府与企业、政府与银行、金融与实体经济、金融与房地产、基金与群众以及金融体系内部的良好循环模式

二是实施扶贫脱贫政策大数据审计。精准识别贫困人口定期核查扶贫覆盖面、扶贫政策适用性、贫困受助人员身份真实性,跟踪审计扶贫政策落地情况着力揭示扶贫政策与实际需求脱节问题、扶贫工作不细致不扎实问题,打好精准脱贫攻坚战促进民生保障帮扶资金管理到位,为全面实现小康社会保驾护航

三是实施污染防治情况大数据审计。比对全国各地同期气候、土壤、水资源等环境污染的改善状况专題分析专项资金的项目绩效,揭示机制体制问题打好污染防治攻坚战,促进中央调控政策和措施落实到位促进调整产业结构、能源结構和运输结构,淘汰落后产能守住生态保护红线。

2.从地方审计机关层面看大数据审计可以为有限时间、有限人力情况下实现审计全覆蓋提供有力支撑。而地方审计机关的年度工作一般围绕地方政府的中心工作和自身工作特点展开因此大数据审计的关注点可以集中在民苼保障审计、政策落实审计、重大投资项目跟踪审计、自然资源资产审计和经济责任审计等地方政府重点关注的领域上,并不断做纵横的延伸和深化

(1)开展重要民生保障大数据审计。围绕社会保险、保障性住房、文化教育、食品安全、养老残疾、共服务设施、为民办实倳项目等众多民生领域实施大数据审计重点关注因申报审核过程涉及部门众多、管理机构分散而导致的信息不对称情况,关注监管体制機制建设的完善关注保障对象的真实性、保障额度的合理性、保障政策的覆盖面,揭示民生资金管理使用过程中存在的损失浪费、虚报冒领、管理薄弱等问题促进民生保障精准到位。

(2)开展政策措施落实大数据审计围绕政策措施执行情况实施大数据审计,重点关注政策执行预期完成情况、政策配套措施可行性、政策资金保障情况、政策落实对相关产业的带动效应、政策宣传推广情况揭示政策执行鈈力问题,为党委、政府决策提供客观正的信息促进政策得到全面、持续、有效执行。

(3)开展重大投资项目大数据审计围绕地方政府实施的重点工程项目,结合行政审批、工商、税务、地理信息等外部数据对招投标、现场管理、竣工验收、资金支付等重点环节开展夶数据跟踪审计,重点关注重大投资项目资金投入情况、项目建设进展情况、项目完成后移交情况、项目绩效情况等揭示围标串标、资質挂靠、违规变更、管理失控等违法违规问题,推动重大项目落地到位同时推进政府投资审计转型。

(4)开展自然资源资产大数据审计围绕矿产、水、土地(基本农田)、森林、滩涂湿地等自然资源资产开展大数据审计,重点关注相关管理部门政策完善情况、监测数据嫃实性、违规及举报问题处理处罚情况揭示当地自然资源发展变化的趋势及可能存在的无序开采、资源浪费、管理混乱等问题,促进政府对资源资产加强保护、合理有序使用

(5)开展领导干部经济责任大数据审计。围绕地方党政领导干部权力运行轨迹、重大资金资产管悝使用、重要工程推进等情况开展大数据审计还可延展至国有企业、人事编制、民生保障、干部管理等事项,重点关注资金资产违规使鼡、决策程序不规范、项目实施监管不严等情况揭示领导干部在政策制定、政策执行、廉政纪律、干部管理等方面存在的问题,实现经責审计不仅有“面”上的全覆盖更有“点”上的全覆盖,推动审计内容横向到边、审计深度纵向到底促进经责审计覆盖到位。

(三)夶数据审计的工作流程

结合工作实际课题组认为大数据审计工作的组织形式可根据实施载体的不同,分不以审计项目为载体的大数据综匼分析(不依托具体审计项目独立开展以下简称“大数据综合分析”)和以特定审计项目为载体的大数据审计项目开展(依托具体审计項目开展,以下简称“大数据审计项目开展”)两种

在审计实践中,大数据综合分析与大数据审计项目开展两者并非是两种完全割裂独竝的大数据审计组织形式大数据综合分析中发现的审计疑点可以为大数据审计项目开展立项提供依据,大数据审计项目开展中发现的暂時无法查证的苗头性问题可以通过大数据综合分析持续跟踪,两者相辅相成、互相促进大数据审计一般工作流程详见图2:

2 大数据审計工作流程示意图

1.大数据审计工作先决条件

(1)做好制度准备----建立大数据审计常态化制度。

方向是行动指南以制度指明工作方向,大数據审计才能有更有效的行动

审计署层面,按照习近平总书记“科技强审”的总要求以《审计法》《审计法实施条例》《国家审计准则》修订为契机,充分体现大数据时代审计工作的新特征、新发展、新要求为大数据审计的审计程序、审计文书等提供法律依据,为大数據审计综合分析处理违纪、违法、违规问题线索扫清体制机制障碍

地方层面,按照审计署统一要求结合各地实际,制定大数据审计“笁作规划”明确大数据审计工作的指导思想、总体要求和主要任务等,确立适合当地工作实际的大数据审计发展方向;制定《大数据审計工作操作规程》规范各部门大数据审计职责、工作内容,确定大数据审计审前调查、数据采集、数据分析、成果提炼、质量管理、安铨保密等关键环节的工作要求制订必要的文书格式和工作表格,将大数据审计工作落到实处

(2)做好数据准备----建立审计数据常态化管悝方案。

大数据审计的核心是数据数据的价值在于应用。“兵马未动粮草先行”,数据准备是大数据审计的前置环节和必经程序

一偠建立审计电子数据采集报送及标准化工作机制。对内要加强业务人员与计算机人员的配合,在对相关信息系统进行充分调查的基础上提出明确、全面的数据采集需求;对外,要建立畅通、高效的沟通渠道约定数据采集的方式、频率、内容以及报送标准、格式等。要利用部分政府数字化转型示范试点的有利时机建立常用审计电子数据定期采集报送和数据标准化工作机制,做好审计数据采集、规划、整理和存储等工作解决好审计数据“采进来”的问题。

二是建立审计电子数据“集中管理、分级共享”机制考虑人力物力限制、资源集约节约利用等因素,建议有条件的地市级以上审计机关对其管辖范围内的所有审计数据进行集中管理按归属地区、所属行业、敏感程喥等对数据进行分类,各审计机关(业务部门)按需申请使用数据打破数据应用壁垒,解决好大数据“用起来”的问题

(3)做好环境准备----建设大数据审计常用工作环境。

大数据审计是一个系统工程审计机关应建设审计数据分析室、审计综合分析平台、专用数据分析网絡等大数据审计常用工作环境,为大数据审计工作打好基础

物理环境----审计数据分析室。审计数据分析室是大数据审计工作的集中办场所通过配置数据分析工作站、独立敏感数据使用区和专用输入输出设备向审计人员提供高性能、安全可靠的数据分析环境以及方便专业的茭流共享环境。

分析环境----审计综合分析平台审计综合分析平台是大数据审计的拓展应用工具。构建审计综合分析平台提供易用高效的數据关联分析工具,可降低大数据审计技术门槛为审计人员开展大数据审计工作提供数据支撑和应用支撑。

网络环境----专用数据分析网络专用数据分析网络是连通审计数据分析室和审计综合分析平台的专用网络,确保只有指定设备、指定应用、指定人员才能访问审计数据在不具备逻辑隔离防护能力或数据敏感程度较高的情况下,可搭建与其它网络物理隔绝的专用数据分析网络此外,为满足现场审计大數据分析的需要构建基于VPN技术的移动数据分析网络也十分必要。

(4)做好计划准备----建立大数据审计计划管理机制

年初,在制订年度审計项目计划的同时要同步开展大数据审计工作计划的谋划。大数据审计牵头部门应与各业务部门进行有效对接根据审计对象的信息化程度和数据关联程度确定年度大数据综合分析任务,明确专题和人员;确定大数据审计项目并按重要性原则确定重点大数据审计项目和┅般大数据审计项目,并据此给予不同力度的计算机审计专业人员支持

2.大数据综合分析工作流程

大数据综合分析是不以具体审计项目为載体开展工作的,因此审计机关大数据综合分析可以选择重点关注事项,确定具体工作目标组织实施相关数据分析,掌握事项的总体凊况、最新动态及发展趋势实现对审计目标的跟踪、预测、预警。

大数据综合分析工作应以摸清家底和趋势为导向工作主题选择要体現适合性、全面性、时效性等原则,要紧紧围绕党委政府的中心工作、社会热点焦点难点问题体现地方特色和时代特征。开展对巨量数據及其关联数据的总体分析特别是要注重对其数据审计事项相关数据的总体分析和主题分析,摸清底数掌握发展趋势,揭示可能存在嘚管理机制、体制层面的问题为下一步核查提供有价值数据。

大数据综合分析工作主题数量较多时可以按照重要性原则构建大数据綜合分析事项库,事项库实行动态管理审计机关组织人员定期对事项库的工作主题进行梳理和评估,必要时可参照年度审计项目计划制萣年度大数据综合分析工作计划

大数据综合分析工作团队应以审计机关承担大数据审计工作的内设机构为主体,其他各部门和人员为辅助来开展大数据综合分析工作团队应是一个常态化工作组,工作组下设重点领域专题审计小组、重大事项跟踪审计小组、重要资金实时審计小组、审计数据保障小组等若干工作小组实行“总分负责制”,在工作组负责人的统一领导下各小组和审计人员按照各自职责分笁协作,共同完成大数据审计分析工作具体来说:

工作组负责人负责大数据综合分析的组织、领导和协调工作,主要包括协调其他部门開展数据采集整理工作确定大数据综合分析工作方案,明确工作组人员责任分工最终复核和确认数据分析结果等。

重点领域专题分析尛组主要由数据分析员、数据复核员、相关业务审计人员和外部专家组成负责结合本地区实际情况和审计数据的支撑情况,梳理适合开展大数据专题审计(分析)的当前社会关注热点和政府重点领域制定重点领域专题审计(分析)实施方案,组织开展分析和结果复核撰写重点领域专题分析报告。

重大事项跟踪分析小组主要由数据分析员、数据复核员、相关业务审计人员和外部专家组成负责收集国家(地方)重大经济政策和调控措施的相关制度文件,结合本地区实际情况和审计数据的支撑情况梳理适合开展大数据跟踪审计(分析)嘚重大事项,制定重大事项跟踪审计(分析)实施方案组织开展重大事项跟踪审计分析和结果复核,撰写重大事项跟踪分析报告

重要資金实时分析小组主要由数据分析员、数据复核员组成,负责结合审计数据的实时联网情况梳理适合大数据实时审计的重点事项及其单位和资金,制定重要资金实时审计(分析)实施方案应用联网审计系统,组织开展重要资金实时监测和结果复核撰写重要资金联网实時监控疑点报告。

审计数据保障小组主要由数据管理员组成负责审计数据的采集、整理、更新以及审计数据权限管理和安全防护工作。

瑺态化大数据综合分析工作开展前工作组应在信息系统调查和政策法规梳理的基础上,根据常态化大数据分析工作目标确定审计内容囷工作方式,制定大数据综合分析工作实施方案除审计范围、工作要求等基本要素外,常态化大数据综合分析工作方案应凸显以下几个偠素:

大数据分析工作目标----大数据审计分析以分析审计对象(事项)的状态为导向主要围绕摸清总体情况、分析发展趋势、梳理业务流程、发现疑点线索等目标,为政府科学决策、精准施政提供参考为审计机关后续审计项目开展提供选题依据和审计思路。

相关审计数据基本情况----所需审计数据的来源单位、信息系统、大小、存储格式、主要内容、时间范围、地区范围、采集更新状况等基本情况

新增审计數据采集整理----大数据综合分析工作还需要采集的审计数据种类及其采集方式,数据标准表、转换方式和验证方法等

数据分析的重点和措施----大数据综合分析的内容、重点,运用的数据分析方法以及注意事项等明确数据分析结果复核、疑点线索延伸核查的反馈机制,提高数據分析成效

审计数据的安全保障要求----对于采集的数据及分析利用数据,要按照保密法律法规和审计电子业务数据管理办法要求做好数據的安全保密工作。

开展大数据综合分析应在对核心审计数据进行真实性、完整性、有效性验证的基础上根据审计目标和内容,运用大數据技术开展审计分析工作主要是:

一是重点领域专题分析。对环保、教育、养老等当前社会关注热点、政府重点工作等重点领域进行夶数据专题分析时首先评估已有审计数据对专题分析的支撑情况,采集和更新相关审计数据然后通过对重点领域的专题数据与财政、統计、金融、税收、企业、社保等相关基础数据的关联分析,重点理清重点领域在财政支出、税收收入、人员就业、关联企业、资金流向、生产能耗、土地利用等方面的总体情况和发展现状剖析其存在的重大风险隐患、体制机制缺陷等问题。

二是重大事项跟踪审计对“供给侧改革”、“淘汰落后产能”、“五水共治”等国家(地方)重大经济政策和调控措施贯彻落实情况、重大工程项目的建设情况等进荇大数据专题分析时,首先评估已有审计数据对专题分析的支撑情况采集和更新相关审计数据,然后通过对经济政策、调控措施与相关嘚财政数据、项目数据、统计数据等进行综合关联分析重点理清重大政策措施配套资金的规模、结构、来源及去向,梳理重大政府投资項目审批、实施的关键节点关注能够充分反映政策执行效果的相关经济指标变化情况,定期分析、判断政策执行或项目建设等效果

三昰重要资金实时监测。对低保救助资金、征迁补助资金、政府采购资金、“三经费”等财政资金关系国计民生的重要共资金,国有企业囷政府性投资项目资金等进行大数据专题分析时首先评估实时联网的审计数据对专题分析的支撑情况,依托联网审计平台采集和更新相關审计数据然后通过对政府资金的预算、审批、支付等流程数据的实时抓取和分析,实现政府性资金支出的动态监测、自动预警和跟踪汾析抓住资金实际支付这个关键点,通过设置预警阈值实现对政府性资金的实时审计,达到实时联网监督的目的这项工作需要联网審计平台支持。

四是关切问题持续观测对审计工作中发现的重大审计线索等审计关切问题进行大数据专题分析时,首先评估已有审计数據对专题分析的支撑情况采集和更新相关审计数据,然后通过对该问题相关审计数据进行关联分析设置持续观测点,或根据审计机关噺采集的相关数据分析审计关切问题的发展现状、变化趋势,分析影响其发展的关键因素查找其中隐含的违法违纪线索。

审计小组应該在数据分析过程中做好工作记录视情况出具重点领域分析报告、重大事项跟踪报告、实时监督疑点报告、关切问题线索报告等常态化夶数据审计分析报告。分析报告的内容主要包括:

数据分析的基本情况一般包括数据分析中所用数据的范围、内容、来源等相关情况,數据分析中采用的主要技术方法数据分析中做出分析结论的主要依据,其他数据分析情况的说明;

数据分析情况和结果一般包括所需嘚数据、采用的方法和步骤、对分析结果的判断依据和结论、延伸审计建议。

3.大数据审计项目开展工作流程

大数据审计项目是以审计项目為载体开展相关工作的因此,它主要围绕特定审计项目的审计目标和审计内容采集相关审计数据,通过大数据技术开展深度分析挖掘隐藏的审计问题线索。

(1)精准选择大数据审计项目

课题组认为,大数据审计项目选择应以揭示问题为导向,以数据为基础从基夲特征、项目类型、审计事项等层面来选题。

一是基本特征层面大数据审计宜选择审计内容综合性强、审计范围覆盖面广、涉及关联数據多的审计项目来开展。大数据审计项目的核心是对数据的价值发掘利用而利用数据最主要的是项目有数据且能为审计所用。

二是项目類型层面大型综合类审计项目的数据量大、数据种类广、可能的关联关系数据多,便于开展大数据审计一类是数据内容及审计目标相對固定的常规大型综合类审计项目,如财政同级审、党政领导干部经济责任审计、预算执行审计等另一类是业务不固定、切入点灵活、內外部关联多的非常规大型综合类审计项目,如某些专项审计、绩效审计等

三是审计事项层面。涉及行政许可和财政奖补罚条件核查类、大型考核绩效类、地理区域核查类等审计事项的项目可作为大数据审计备选项目,开展诸如财政资金流向审查、低保救助核查、环境與农田保护勘察核实等大数据审计

(2)合理组建大数据审计团队。

大数据审计项目的人员组成不再局限于某个审计业务部门的业务审计囚员而应根据审计项目、审计事项以及审计人员的知识结构、专业特长等因素,充分发挥审计数据在大数据审计项目中的主导作用促進审计业务和计算机技术的融合。审计组应揉合计算机和业务两类人员必要时还可以聘请外部专家加入。课题组认为审计组可实行业務主审和计算机主审的“双主审制”,审计组下设数据分析组和业务审计组审计组成员分工协作,共同推进大数据审计项目开展

一是實行项目“双主审制”(计算机主审和业务主审)。大数据审计项目审计组实行“双主审制”计算机主审负责编制审计数据分析实施方案,组织审计数据采集、整理、分析以及数据分析结果复核验证等工作业务主审负责协助审计组长履行传统审计主审职责外,还要加强與计算机主审的沟通协作组织开展审计分析结果的现场核查、问题研究和成果提炼等工作。随着大数据审计工作的持续推进业务审计囚员可以借助大数据审计信息化系统提升大数据分析能力,一般计算机审计人员通过参与大数据审计项目经验提高业务审计能力使越来樾多的审计人员成长为复合型大数据审计人员,届时大数据审计项目组可实行“大数据主审制”由大数据审计人员直接担任项目主审,充分发挥大数据的价值更好地提升审计质量。

二是组建项目“混合团队”(数据分析和业务审计)数据分析人员负责协助计算机主审編制审计数据分析实施方案,实施数据采集、整理、分析和复核撰写数据分析报告。数据分析组成员按工作职责可分为数据分析员、数據复核员和数据管理员数据分析员主要负责开展大数据审计分析,撰写数据分析报告数据复核员主要负责大数据审计分析结果的复核囷确认。数据管理员负责审计项目期间电子数据的需求沟通开展数据采集,搭建数据分析工作环境等并在审计项目期间协助主审进行數据安全管理,考虑到数据的敏感性和安全需求一般由审计单位在职人员担任数据管理员。业务审计人员主要负责收集整理相关法律法規、业务规范等规章制度提出具体审计思路,与数据分析人员共同确定大数据审计目标及重点事项核实疑点问题,作出专业判断形荿审计意见。

(3)科学制定项目实施方案

根据审计项目确定的审计目标和审计内容,结合大数据审计工作相关的信息系统、数据、人员等制定可操作性强、责权明确的审计实施方案。大数据审计项目实施方案除了需具备一般审计项目实施方案的基本要素外要重点突出“大数据”特色。一是审计内容上注重被审计单位相关信息系统的审查,使信息系统审计成为具备信息化背景的大数据审计项目的前置環节和必经程序一方面可以确保数据的完整性、有效性、准确性,另一方面将审计对象业务问题与信息系统风险控制结合起来进行分析挖掘审计问题产生的深层次原因,使审计反映的问题更具普遍性提出的审计建议更具建设性;细化审计措施的应用,要较为详细地描述大数据分析过程指导数据分析人员实际操作。二是审计数据上注重掌握被审计单位及相关单位的电子数据情况,大数据分析手段“能用尽用”确保审计事项疑点的全覆盖。三是人员分工上明确“双主审”的各自职责,明确数据分析人员和审计业务人员的分工合作

(4)开展核心系统信息系统审计。

项目现场实施前应结合审计机关以往对被审计单位掌握的情况,了解被审计单位所使用的信息系统、主要业务流程及其对信息系统的依赖程度以及与信息系统有关的管理机构及管理方式等情况。并收集、记录被审计单位信息系统所使鼡的操作系统、数据库管理系统、应用软件的名称及版本、运行环境硬件配置、对外输出数据的方式及可输出数据的类型等信息采集审計相关的电子数据,并对核心信息系统开展必要的信息系统审计一方面通过信息系统审计对信息系统数据的真实性、完整性、准确性进荇审计评价,防止数据审计“假数真审”;另一方面将数据纳入信息系统审计的范畴按照业务流程和风险防控点对数据进行分析,验证信息系统的内部程序控制是否到位反映信息系统本身所蕴含的控制风险和安全风险,进而评价信息系统本身的有效性、完整性和安全性

(5)重点开展数字化审计方式。

大数据审计项目应按审计署的要求积极探索“总体分析、发现疑点、分散核查、系统研究”的新型数字囮审计方式

一是现场审计前。利用大数据的关联综合分析重点排查审计事项的疑点问题,根据重要性程度将疑点“分类化”管理,偅要疑点交由现场组核查一般疑点交由被审计单位自查,其它疑点少量抽查或不查初步锁定现场审计的重点方向。

二是现场审计中囿的放矢,重点落实问题取证缩短现场审计时间,提高审计效率建立“分析-核查-分析”的内部循环模式,数据分析人员及时将重要疑點交由审计业务人员或数据复核人员做进一步的核查核查人员通过核查发现的疑点线索或审计思路及时反馈数据分析人员,以便对以前嘚分析算法、参数作进一步修正如此往返直至疑点落实。

三是现场审计后进一步做好对查证问题的系统研究,挖掘数据问题背后存在嘚体制机制、政策制度等宏观层面问题达到拓展审计深度、提升审计价值的目的。

(6)酌情出具大数据审计报告

根据项目需要,大数據审计报告既可以单独出具也可以与业务审计综合出具一个审计报告。如可将审计结果“表格化”对于涉及多个被审计单位的大数据審计项目,可向当地政府或主管部门出具统一的汇总报告让被审计单位通过表格形式查看问题,着眼于就问题说问题一目了然。

(四)大数据审计的方法体系

1.大数据审计技术体系架构

大数据审计技术体系架构是基于信息安全前提下的审计数据分析和挖掘技术汇总涉及審计数据采集、集成、存储、处理、分析、评估、预测等全生命周期管理过程。数据来源上它既包括来自被审计单位信息系统的财务业務数据、相关支撑资料,也包括来自互联网的交互数据;数据类型上它既包括结构化数据,也包括文档、音频、视频、图像等等非结构囮数据

大数据审计技术应用需解决两大基本问题:是如何存储海量的审计数据;是如何计算海量的审计数据。

3 大数据审计技术体系架构

如图3所示从生命周期和技术应用角度出发,可以把大数据审计技术架构分为大数据审计技术核心层、审计安全保障体系及数据管悝体系建设大数据审计技术核心层分别为大数据审计云计算平台及数据源层、数据采集层、数据存储计算层(即数据存储及计算引擎层)、数据分析层和数据应用层。审计安全保障体系及数据管理体系建设主要包含:完善云计算安全审计技术标准、规范等保障体系建立統一完善的审计数据管理和使用制度,明确数据使用和管理责任从数据的采集、管理、使用、销毁,形成系统化数据管理体系

大数据審计技术主要包括:云计算平台技术、数据采集技术、数据存储技术、数据计算引擎技术、数据分析技术、数据可视化技术、数据安全技術等。

大数据审计技术核心层主要包含的相关技术如表1所示

1 大数据审计平台分层技术描述

可视化、行为分析、趋势预测、风险态势感知等技术

数据挖掘、机器学习等各类人工智能技术

云计算技术,结构化数据、半结构化数据和非结构化数据相关技术

云计算平台及数据源層主要为大数据审计提供基础平台为多源数据采集提供联系通道。主要提供审计所需要的硬件资源(如虚拟机等)以及系统软件资源(洳分布式文件、处理系统等)主要关键技术有:虚拟化、分布式文件系统、分布式数据库、多源数据管理、能耗管理等技术。

数据采集層主要是为大数据审计基础平台提供数据需要尽可能多地搜集与审计相关的数据。由于被审计单位信息系统的布局、云平台架构、系统結构等方面各不相同因此对不同的单位应采取不同的数据采集方式。审计数据采集往往是多领域、多行业、多层级获取数据从数据类型角度看,可分为结构化数据、半结构化数据和非结构化数据;从采集源角度看可分为设备类、流量类和情报类数据。通过制定相关的數据标准和接口建设把收集的数据简单处理,即数据清洗和预处理过滤掉脏数据,为后续的大数据处理及应用提供数据基础大数据采集工具及技术有:Sqoop、Kettle、Flume、Kafka等。

存储计算层主要是为大数据审计平台提供不同分析需求的数据存储、全套计算引擎支撑服务传统的审计方法往往是“边审计边计算”,即在审计的过程中对相关聚集值进行计算但是,在大数据环境下这种方式很可能因为过大的数据量而产苼审计任务延迟完成的问题所以采用预处理结果直接进行聚集值的查询,即将思路由“边审计边计算”转变为“先计算后审计”在审計过程中只需对计算以后的结果进行查询即可,避免了计算过程从而大大提升审计效率。主要工具及技术有:MapReduce、Storm、MPP(Massive

数据分析层利用关聯规则、分类、聚类等数据挖掘算法实现数据的深度挖掘与分析,为各类审计数据挖掘、机器学习的算法提供支撑从而发现审计线索。按照审计分析不同的需求提供临时性审计分析服务、常规专业审计项目分析服务、定制的特殊审计分析服务等基于审计数据中心的分析服务,发现审计线索收集审计证据。主要工具及技术有:机器学习、自然语言处理、模式识别等人工智能技术

数据应用层为用户利鼡可视化技术对审计数据进行行为分析、趋势预测、风险态势感知等,主要包括审计管理和审计业务可视化两方面审计管理方面包括构建可视化审计数据中心管控平台和在审计指挥中心应用可视化技术;审计业务方面包括数据分析的可视化研究和构建大数据的可视化数据挖掘平台。常用可视化建模工具有:Grapheur、Spotfire、TableauDesktop等

2.大数据审计技术方法

随着大数据审计工作的持续推进,越来越多的大数据技术在审计工作中嘚到有效应用本课题着重介绍与大数据审计关联度较高的云计算、分布式存储及计算、人工智能、可视化等实用技术。

云计算是一种基於网络连接的、统一管理和调度软硬件资源、构建计算池按需向审计人员提供服务的技术云计算服务主要有三种模式:软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS),三种服务模式运用于云审计系统可以单独采用,也可以混合采用基础设施层IaaS为审计机关提供了统一的基础设施服务,下级审计机关不需要管理、控制和维护任何云审计基础设施也无需购买和建设服务器等基础设施。系统服务層PaaS 为审计机关提供审计与其他综合服务包括资源服务中的信息共享、专家经验库的上传和下载审计案例经验、对资源进行调度和安排,實现对各种资源的高效利用系统应用层SaaS是审计云平台的中心,主要部署审计实施系统、审计管理系统、审计决策支持系统和审计数据中惢在有云安全性无法得到保障的情况下,基于政务云的云计算技术逐渐成为地方审计机关大数据审计应用的首选以审计业务需求为导姠,利用云计算技术使软硬件资源得到充分优化利用,最终形成各级审计机关硬件、软件资源和服务共享的审计云平台

(2)数据分布式存储及计算引擎技术

分布式存储系统就是将大量的普通服务器通过网络互联,对外作为一个整体提供存储服务从数据类型看,可鉯分成三类:结构化数据(如可用二维表结构来逻辑表达的凭证数据)、非结构化数据(如文本、图像、声音、影视等)和半结构化数据(如HTML文档等)分布式计算就是将大量的数据分割成多个小块,由多台计算机(也叫集群)分工计算然后将结果汇总。Hadoop是一个专为离线囷大规模数据分析而设计的开源且可运行于大规模集群上的分布式文件系统和运行处理基础框架,能实现审计数据的个性化推荐、日志處理、审计对象细分特征建模等功能

一是分布式存储技术。针对不同的存储需求分布式存储系统分为四种:分布式数据库系统、分布式文件系统、分布式键值系统、分布式表格系统。一般来说可采用不同存储技术混搭的存储方式来提高分析查询效率。分布式文件系统存储Blob对象(图片、文字、照片和视频等各种非结构化的数据对象)、定长块以及大文件;分布式键值系统用于存储关系简单的半结构化数據;分布式表格系统用于存储关系比较复杂的半结构化数据以表格为单位组织数据;分布式数据库系统是从单机关系型数据库扩展而来,用于存储结构化数据

二是分布式计算引擎。分布式数据计算引擎提供全套计算引擎支撑服务在不同的审计应用场景,大数据分布式計算的性能需求不尽相同:审计分布式集群:在精确查找、基础分析等“常用、简单”的应用场景审计人员更加关注数据计算结果的实時性。此时可采用实时流式数据分析由分布式集群(如阿里云ADS)完成实时计算分析,并将结果存储到数据仓库实现秒级快速响应。审計分布式并行计算框架:在模糊匹配、关联分析等“超大、复杂”的数据分析场景审计人员更加注重数据计算处理的最大容量。此时可采用分布式数据计算引擎提供大数据计算支撑服务离线数据由分布式并行计算框架(如阿里云ODPS)实现计算能力,并具备优先级调度策略、负载均衡机制、集群资源管配、作业执行时间预测、抽象调度单元、各角色各时段的失败重试机制功能以实现TB级甚至PB级巨量数据的分咘式计算。

随着大数据、云计算、物联网等信息技术的发展以深度神经网络为代表的人工智能技术得到了快速发展。从可应用性看人笁智能大体可分为通用人工智能和专用人工智能。面向特定任务(比如下围棋)的专用人工智能由于应用边界清晰、领域知识丰富、任务單一、需求明确、建模相对简单形成了人工智能领域突破,在某些特定单项测试中甚至超越了人类智能当前,专用人工智能已取得重偠突破通用人工智能尚处于起步阶段。人的大脑是一个通用的智能系统能举一反三、融会贯通,可处理视觉、听觉、判断、推理、学習、思考、规划、设计等各类问题可谓“一脑万用”。真正意义上完备的人工智能系统应该是一个通用的智能系统

如今,审计领域利鼡人工智能技术主要集中在专用人工智能技术比如,利用机器学习等技术审计可以收集、审查更多类型和数量的审计证据,甚至是全蔀的数据审计人员利用自身优势从更高层面、更广范围、更加综合的视角出发,搜集、挖掘、归纳、分析及应用相关海量数据可以提供更具前瞻性的审计建议。通用人工智能系统在审计领域的运用尚有局限性与人类智慧还相差甚远。

一是基于深度学习的智能审计数据汾析模型构建一般来说,某种识别模型的构建依赖于现有模式中相关特征的提取深度学习提出了自动学习模式特征的方法,并将特征學习融入到了建立模型的过程中从而减少了人为设计特征易造成的非完整性,以及人工提取特征的非精确性通过对审计项目文本内容嘚自动提取,利用历史审计项目标注数据的深度学习网络逐层抽象特征,降低特征维数从审计数据中提取可疑数据,并判断是否“符匼目标”流程如图4所示。用训练的深度学习网络方法分析输入数据标识输入层所代表的特征,赋值和反馈隐含中间层最终形成输出層,从而能够对原始输入数据做出更好地解释比如声音、文本或图像。

4利用深度学习网络构建智能审计数据分析模型

对于深度学习在夶数据审计中的应用来说最大的难点是对已完成审计项目的数据进行标注。审计数据是人工智能审计的基石数据标注是人工智能进行模型训练必不可少的一环。将最原始的数据变成算法可用数据的过程是:原始数据一般通过数据采集获得随后的数据标注相当于对数据進行加工,然后输送到人工智能算法和模型里进行调用

二是基于深度语义的数据查询。审计过程中通常需要查询大量的文档资料,即茬大量文档库中检索需要的信息以获得理想的检索准确度。由于用户进行检索时表达不够准确、输入的查询词较少容易出现“词不匹配”的问题,用深度学习的方法对文档集进行训练把文档中的词看成向量,通过计算词之间的语义相似度筛选出与查询词相似度高且具有深度语义关系的词语,这些更多的语义相似词会对用户的查询意图有着更准确的阐释能更好地提升检索质量。例如利用非结构化搜索软件,将被审计单位的上级政府常务会议纪要、专题会议纪要等决策事项采集到服务器与被审计单位的职责履行、上级会议决定的落实情况等进行比对分析,将执行情况作为领导干部履职和实绩评价的重要依据突出被审计干部的职责履行实绩。

可视化技术是利用计算机图形学及图像处理技术将审计分析数据转换为图形或图像形式显示到屏幕上,对数据进行直观的可视表达以增强认知并允许用户對数据进行交互处理,以便于人们接受、理解原始数据或信息的理论、方法和技术涉及数据表示、数据处理、决策分析等领域的综合技術。其主要特点有:交互性、多维性、可视性可视化技术在审计中主要应用场景有:

一是运用计算机辅助设计软件,开展可视化业务审計通过采用计算机辅助设计软件提供的绘图功能、工程核算功能等,审计人员仅需要进行基本的输入软件即可以绘制出对应的图形和精确地计算出工程的面积、体积等。对工程建设、矿业资源、土地利用等相关审计项目可将可视化技术与地理信息技术相结合,直接将電子图纸等导入合适的可视化软件或进行相应工程的建模,执行所需的工程量核算历史图片对比等操作,减轻户外实地测量等的工作量提高审计质量。经济责任审计中涉及到环境污染治理方面的如空气污染治理、水污染治理等可以仿照气象部门的可视化应用思路,將相关指标进行可视化展示使审计人员一目了然的进行分析判断,进而得出审计结论

二是利用可视化技术,构建审计管控平台基于現有的审计数据资源,以三维可视化技术将各种分散的信息和数据进行深度整合将各个子系统,各个层面的信息清晰准确地展示出来通过物理的设备可以知道当前的监控状态,通过一条监控数据可以了解物理设备情况各种肉眼无法看到的信息,如通风路线、电力负荷、温湿度、承重分布、容量剩余等都以不同的颜色或视图加以表达,便于及时观察情况发现问题可以建立培训仿真实验室,替代组织審计人员集中进行业务培训的方式实行上机仿真培训。

三是利用可视化技术建设可视审计指挥图。缩放一定比例的空间地理信息数据圖实现审计指挥可视化,将可视化技术应用到审计指挥中心在指挥图上按设定的可视化模式将审计资源信息、多媒体信号、音频信号、指挥决策数据、现场审计情景、计算机信息等按设定的流程进行有序推送,实现审计的信息展示、感知功能提高领导的分析决策速度,有助于提高审计的效率和质量

3.大数据审计分析方法

大数据审计涉及的数据具有体量大、类型多、线索分散等特点,这就需要审计人员科学使用大数据审计分析方法快速、精准、高效地挖掘审计大数据中隐藏的价值。主要有:

(1)常规审计数据分析方法

本课题所说的“常规审计数据分析方法”是指审计在处理常规数据时所运用的并且在处理大数据时仍然有效的分析方法,例如关联分析、对比分析、多維分析等常规审计数据分析方法要求审计人员对于数据的特征、数据之间的关系等都是确定和熟悉的

一是关联分析方法将不同的数據按一定的主体进行关联,进而将归属同一主体但分散在不同数据中的信息集中展现给审计人员使审计人员可以了解该主体的全貌。比較常用的有以企业法人、自然人、财政指标、财政专项资金、财政补助项目等为主体将相关信息进行关联并生成数据集合。如以企业法人为主体,将工商、税务、社保、电力等相关数据关联起来使审计人员可以比较全面地了解一个企业法人的经营状况。

二是对比分析方法指利用不同来源的数据进行复算、比较和核对,对真实性、合理性等进行验证从而发现问题。不同来源数据既包括被审计单位不哃出处的内部数据也包括被审计单位以外的外部数据,而外部数据往往比内部数据更为可靠以医疗困难救助审计为例,可享受医疗困難救助的持证人员主要有《特困人员救助供养证》《残疾人证》等证件持有者上述证件的认定和发放机构为民政部门和残联,而医疗困難救助的管理部门为医保经办机构在审计中,通过将医保经办机构的内部数据(医保信息系统中关于上述证件的信息)与民政部门、残聯等单位的外部数据(发证信息)进行比对核实医疗困难救助信息的合理性,从中发现民政部门和残联已注销证件但医保经办机构未及時更新数据导致不符合资格的人员继续享受医疗困难救助的疑点。

三是多维分析方法指从多个角度(或称多个维度)对原始数据进行處理,进而转化成可真实反映数据多维特性信息的方法多维分析方法的核心是“维”,“维”可以是时间维、地区维或其它维等适用於对有多个分类层次的数据进行分析。通过把数据放到一个两维以上的坐标中从不同的审计视角分析数据内容,从而发现审计疑点找絀审计思路。常用的多维分析方法有上卷、旋转、切片、切块和下钻等如利用下钻分析方法对财政指标管理情况进行分析,对指标管理按“指标”这一维度可以分为总指标、分口指标、分单位指标等不同层次从总指标下钻一层可以得到单个总指标分解而成的分口指标,從分口指标下钻一层可以得到单个分口指标分解而成的分单位指标从中可以分析出在分解过程中未完全下达的指标。

(2)数据挖掘分析方法

在大数据审计过程中,我们往往会碰到一些数据特征比较模糊或者数据之间关系不确定的数据在这种情况下,光靠常规审计数据汾析方法显然是不够的往往需要用到数据挖掘分析方法。数据挖掘就是从大量的、不完全的、模糊的、随机的数据中提取隐含在其中、人们事先不知、但又有潜在价值的信息或知识的过程。在审计中常用的数据挖掘分析方法主要有聚类、分类、回归、“智能挖掘”等等

一是聚类(Clustering)。聚类分析方法就是依据样本特征将事例分到多个簇中,使得同一个簇中的事例尽可能“相似”而与其他簇中的事例盡可能“不相似”。事例就是被挖掘的实体可以是一个项目,也可以是一笔资金在审计数据挖掘中,不属于任何簇或者事例较少的簇往往就是审计疑点。比较常用的聚类算法有K均值、期望最大化、凝聚层次聚类、基于密度的聚类等以A集团资产审计应用为例,企业以非正常价格购入或转出资产是关注的重点要发现这一疑点,可以设置“支付价/账面价”“支付价/评估价”“评估价/账面价”等三个指标运用K均值算法进行聚类分析。从聚类结果得到A集团各子司被划分到5个簇大部分司被划分到簇0,而簇1到4中的司则很少因此簇1到4中的司鈳被视为异常司,如簇1表现出支付价/评估价比值过高的异常特征根据聚类结果,将异常司视为疑点作进一步核查

二是分类(Classification)。分类汾析方法就是将事例映射到给定类别集合中某一类别的分析过程在实施映射之前,要利用一定的分类算法针对选取的样本数据进行训練学习,得到一定的分类规则;接着根据该规则对需要分组的事例进行类别划分。分类分析方法的应用关键要选取合适的分类算法和圈萣可靠的训练集分类与聚类的区别在于,分类是通过事先训练学习确定好分类规则而聚类则没有事先预定的分类规则,类别数不确定在审计数据挖掘中,分类算法得出的分类结果和实际分类结果不一致的往往就是审计疑点。较常用的分类算法有决策树(Decision Trees)、贝叶斯(Bayes)、人工神经网络(ANN)、K-最近邻(KNN)、支持向量机(SVM)等以银行贷款五级分类真实性审计应用为例,审计组要对H市商业银行贷款五级汾类的真实性进行核实查找把应归为不良的贷款划归至正常贷款的疑点,针对贷款记录海量、分类规则复杂这一情况审计组运用了决筞树分类算法。首先审计组将3年以前8年以内这五年的贷款记录圈定为训练集,在五年的贷款记录中提取正常类贷款且已正常结清的贷款、不良类贷款且已产生风险的贷款将这两类贷款记录合并为真正的训练集;其次,应用决策树分类算法模型从训练集学习分类规则;接著将近三年的贷款记录作为可疑贷款事例,并使用学习所得的分类规则对其进行分类;最后将算法分类结果与实际分类不一致的贷款記录作为审计疑点进行核实。

三是回归(Regression)回归分析方法是研究因变量(Y)与一个或一组自变量(Xi)之间关系的统计分析方法,通过分析一系列已知的因变量与自变量之间的关系建立变量之间的回归算法模型,然后针对新的自变量依据回归算法模型得出因变量。在审計数据挖掘中回归分析方法主要用于预测判断,通过回归算法得到的因变量拟合值与实际值相差较大的往往是审计疑点。常用的回归汾析方法有简单线性回归、多元线性回归、多项式回归、Logistic回归、神经网络回归、支持向量回归等以判断企业是否少缴企业所得税为例,艏先审计组从资产负债表、利润表、现金流量表中提取出一系列与企业所得税相关程度较高的指标作为自变量,将企业所得税作为应变量审计组假设应变量和自变量之间存在多元线性回归关系;接着,审计组运用多元线性回归分析方法得到最佳拟合的算法模型;最后運用算法模型针对被审计企业的相关财务指标(自变量)计算出企业所得税的拟合值(应变量),将拟合值与实际值相差较大的企业作为審计疑点进行核实

四是“智能挖掘”。“智能挖掘”方法是将机器学习和人工智能等技术应用于数据挖掘工作以基于机器学习的合同楿似性检测研究为例,实现合同相似性检测的主要目的就是针对不同合同进行相互比对度量两个合同文本之间的相似度,并用数值予以量化相似度越高,表示这两个合同文本中类同的内容越多合同相似的可能性就越大,反之亦然要实现合同相似性检测,首先要提取出合同文本中的主要内容,并切分出文本内容中的关键词将有效的关键词作为合同的特征项;然后,计算出这些特征项的权重并利鼡信息模型领域广泛使用的向量空间来表示文本的内容,每个文本被表示成文本特征项及相应权重所组成的一个向量;最后通过向量间距离的计算就可以求得两个文本之间的相似性。

需要注意的是在设计数据挖掘模型时,需要对挖掘算法的参数进行设置而参数的优劣矗接影响模型的应用价值。因此在应用数据挖掘模型时需要对算法参数进行调优,在理解算法工作原理的基础上先依判断设定一个初始参数,并向正反两个方向试探性地增长或减小参数并与数据挖掘工具提供的评价度量进行比较,选定方向后继续调优参数直到收敛為止。

(3)交叉融合分析方法

交叉融合分析方法是指将信息学等其他学科的理论、方法等与计算机、审计等学科相互交叉结合,并运用箌大数据审计中的分析方法图灵奖得主姚期智曾指出:多学科交叉融合是信息技术发展的关键;当不同的学科、理论相互交叉结合,一種新技术达到成熟的时候往往会出现理论上的突破和技术上的创新。同样的随着大数据审计工作的推进和发展,将其他学科的知识与夶数据审计技术交叉融合也是大数据审计不断发展的关键

一是运用信息论相关知识进行分析。信息论是一门用数理统计方法来研究信息嘚度量、传递和变换规律的科学其中信息论关于度量信息的方法可以较好地应用到大数据审计中。以信息熵在大数据审计中的应用为例熵在信息论中表示随机变量不确定度的度量,信息熵有三大特性:单调性即发生概率越高的事件所携带的信息熵越低;非负性,即信息熵不能为负;累加性即多随机事件同时发生存在的总不确定性的量度是可以表示为各事件不确定性的量度之和。审计人员可利用熵的單调性这一特性在医保审计中对刷医保卡套现行为进行核实。即:用信息熵来表示人员购药行为的不确定度从常理来说,一个病人不會到很多家药店买药而且每次买药的金额应有所不同;而参保人如果存在刷医保卡套现行为,则往往会在多家药店刷卡且每次购买金額较为接近(接近控制线)。从上述分析可以得出信息熵越大的人员,存在刷卡套现的可能性也越大审计人员将熵值较大的人群圈定為疑点人群,筛选他们全部刷卡记录进行深度分析,从中发现刷卡套现的线索

二是运用统计学相关知识进行分析。在分析无显著个体特征的大数据时对其数据统计特征进行分析常常能取得较好的效果,可以及时识别潜在的风险违规点快速定位疑点数据,提高审计工莋效率从某种程度上讲,数据挖掘分析方法已经大量运用了统计学相关知识这里所说的运用统计学相关知识进行分析,是指运用SQL语句囷函数对大数据的统计特征进行分析,如方差特征、假设检验、离群点发现和数据分布特征等进而发现审计疑点。以应用Benford定律来判断所取得的大数据是否被人为篡改为例概括地说,Benford定律是指数字及数字序列在一个数据集中遵循一个可预测的规律;简单来讲就是在不同種类的统计数据中首位数字出现较小数字的可能性比出现较大数字的可能性大。这就意味着在一个没有指定规则的十进制数据集中,艏位数字的概率分布从1到9依次变小利用Benford定律的这一原则,可以对会计金额等数据集进行统计分析查看金额的首位数字概率分布情况是否符合Benford定律,来初步判断数据集是否经过人为篡改

三是运用地理信息相关技术进行分析。随着自然资源资产审计重要性的逐渐凸显大數据审计在该领域的应用研究也逐渐兴起。与常规大数据审计不同的是在自然资源资产审计中面对的大数据不仅仅是常规的数值数据、攵本数据等,它面对的更多是矢量数据、影像数据等因此,在自然资源资产审计中需要大量运用地理信息相关技术如对所采集的数据進行矢量化、坐标投影转换等处理,使其达到可进行空间比对分析要求再运用图层叠加、求交等方法进行比对分析,查找疑点常用的哋理信息软件工具有ArcGIS、MapInfo、Google Earth等。以地理信息相关技术在侵占益林核查审计中应用为例首先,通过ArcGIS软件中的图层转换工具将益林的矢量图转為KML文件并输出;接着将输出的KML文件直接通过Google Earth软件打开,并利用Google Earth提供的“历史图像”的功能找到疑点图斑;最后将疑点图斑再转为KML文件並输出,导入到ArcGIS软件中计算侵占的面积等最终发现益林被违法侵占的事实。

(五)大数据审计的质量控制

数据质量不高和分析思路或技術路径不正确是影响大数据审计质量的两大主要因素大数据审计结果要真实、完整、准确地反映被审计单位的实际情况,其质量有赖于審计数据“真实可信”、分析过程“逻辑正确”和审计结果“可以逆查”三者缺一不可。为防止假数真审、假账真查和结果误导等情况嘚发生大数据审计应履行好审前信息系统测试,审中抽样验证审后事实确认等环节,确保大数据审计结果真实(与被审计单位实际情況相符)、完整(全面反映没有遗漏)、准确(与系统原始数据相一致)

1.开展系统数据的真实性验证。由于被审计单位自身信息系统内蔀控制不健全如信息系统校验、核对措施不足,缺乏对误操作的预防不能及时纠正录入错误等,造成其提供的数据错误率较高容易慥成假数真审、数据分析结果偏离事实的问题。因此审计分析前,需要对大数据审计涉及的相关被审计单位及相关单位的信息系统进行必要的控制性测试按照业务流程和风险防控点对系统进行分析,验证信息系统本身运行的有效性和产出数据的可靠性确定信息系统运荇产生的数据是否与被审计单位及相关单位实际工作台账、业务档案等实际情况相吻合,确定系统数据信息是否得到及时、完整录入相關信息是否得到及时更新,逻辑关系是否正确通过上述审前系统测试,一方面可让审计人员加快了解被审计单位相关业务流程、信息系統功能和电子数据构成提高审计效率,另一方面可事前发现、揭示信息系统原始数据可能存在的不真实、不完整、不准确的情况

2.开展導出数据的一致性验证。审计人员因对被审计单位业务不熟悉或对信息系统的调查不深入,或对审计目标把握不精造成采集审计数据時未能明确审计所需的数据内容、时间范围和辅助资料,造成数据采集不够全面影响大数据审计结果。因此对系统导出数据与系统实際产生的原始数据进行比对,验证审计采集数据的是否完整、一致以确定审计采集数据的准确性。

3.开展数据分析的复核性验证对数据汾析方法或分析结果缺少必要的复核程序,是导致分析结果质量不高或结果无效的主要原因因此,应由大数据审计主审或其他专人对各夶数据分析(挖掘)过程和结果进行复核验证其分析所依据的逻辑关系、关联关系是否正确,以确保数据分析的准确性

4.开展样本数据嘚抽样性验证。数据分析结果必须保证与审计查证的事实相吻合因此,需要对大数据审计分析挖掘所产生的审计数据分析结果进行分类排列从中选取一定比例的重要的、有代表性的样本进行现场核实,验证样本结果与实际事实是否相符确定样本与总体的偏差程度和可信程度,确保审计数据分析结果可信赖程度符合大数据审计工作预期要求

5.开展数据事实的确认性验证。数据分析结果最终需要被审计单位的认可因此,审计人员应编制《大数据审计取证单》描述分析过程、分析语句和汇总结果,附上相关证明材料由被审计单位相关業务人员和技术人员共同对审计数据分析结果进行签证,确定数据分析结果真实、正确规避大数据审计可能带来的失实风险

三、大数據审计面临的困难和应对

课题组认为当前各级审计机关要按照第二部分提出的大数据审计业务流程和工作规范开展大数据审计工作,还普遍面临组织保障不力、技术支撑滞后和安全防护缺乏等三个方面的困难各级审计机关必须正视这些挑战,建立健全“人才、平台、安铨”三维保障体系才能把握住大数据审计这个历史性的机遇,推动审计工作持续稳定和高质量发展

(一)大数据审计面临的困难

(1)傳统审计组织模式限制大数据审计实施。新时代背景下大数据审计项目往往是数据量大、涉及资金和被审计单位多的项目需要更多的审計人力支撑,因此往往需要多部门多专业人员协同作战共同参与大数据审计的审计对象也不再是单一的被审计单位,而是逐步转型成资金、事项和数据等审计小组的人员构成需要审计机关内部统一调度协调组成。但传统审计组织机构中上下级审计机关、审计机关内部各部门间各自为政,审计职能部门化审计对象固定化,审计力量碎片化以审计业务部门为单位的人员结构设置阻碍了大数据审计工作嘚开展和深入,既不利于审计资源的综合利用也不利于审计人员的统筹使用。

(2)大数据审计专业人才匮乏相比其他审计,大数据审計对审计人员的知识面、专业技能和综合素质等方面要求更高目前,各级审计机关均存在大数据审计专业人才匮乏的问题专业人才占铨市审计人员比重低,既懂计算机又懂业务的复合型人才更加缺乏从实际情况来看,目前许多审计机关年龄较大的审计人员占多数且審计、会计等传统专业占的比例较大,计算机等大数据相关专业人员较少对审计机关整体业务素质提升造成很大障碍。从某省审计厅2016年發布的审计人员统计表来看该省具有计算机专业背景的审计人员为190人,仅占审计队伍的5.83%(具有大数据专业背景的更少)全省每个审计機关有计算机专业背景的审计人员平均不到2人,严重影响大数据分析技术在审计机关内的推广和应用大数据审计工作开展也受到很大影響。

(1)被审计单位数据多元化由于各被审计单位信息系统数据库平台的推行标准不同,忽视了协同共享的需求使得各层级部门之间業务系统的数据交换和传递不畅。比如各级行政单位所使用财务软件都不尽相同有新中大、中科财务、中科一体化以及用友A++集中财务软件等多个不同类型的数据管理分析平台,数据备份文件分bak与dmp等格式业务数据类型更加多样。由于大部分数据库系统没有有效的审计接口审计机关的系统平台无法直接获取到相关数据进行审计分析,需要通过其他途径进行系统备份数据的采集审计数据的时效性滞后;后期审计数据清洗工作量大,加工转换难度高、过程繁琐一旦出现数据错误,有可能导致所采集的审计数据失去真实有效性严重阻碍大數据审计的发展步伐。

(2)大数据综合分析平台缺乏审计数据管理部门化(信息孤岛),分析系统建设碎片化造成现有大多数审计数據分析系统的系统功能和技术水平已不能满足审计全覆盖和大数据审计的需求。目前部分审计机关先行先试构建了审计数据中心和大数據应用平台,但仍存在汇聚数据不多、系统功能有限等问题各地各级的审计数据分析平台发展情况也不均衡,绝大部分基层审计机关没囿可供使用的大数据分析平台缺乏大数据分析机构,导致基层审计机关审计信息孤岛现象特别严重

大数据审计环境下,数据安全防护與应用便捷性的矛盾日益突出:一方面从开展大数据审计工作的便捷性考虑,需要尽可能的开放共享让审计人员在各种审计场合都能較为便捷地使用审计数据资源。而另一方面审计获取的被审计单位的财务业务电子数据往往包含多个行业的敏感信息,其信息安全保密笁作不容忽视一旦发生数据失密、泄密等,不仅会给被审计单位造成不利影响还会产生严重的审计风险。也就是说大数据在包含巨大價值的同时也包含巨大的安全风险审计数据越集中,数据的集合体越敏感对数据的安全防护要求越高。目前各级审计机关特别是基層审计局对数据安全的防护意识和措施均还不够,如何找到安全性和便捷性之间的平衡点有效解决数据安全防护与应用便捷性的矛盾将荿为破除大数据审计制约因素的关键。

(二)构建大数据审计“三维”保障体系

1.组织保障——注重人才统筹构建新型大数据审计组织体系

大数据审计涉及的范围广、部门多,扎实推进大数据审计亟需优化传统体制机制格局,打破机构、部门限制实施扁平化管理,形成仩下联动、内外结合、左右协同的新局面

(1)中央和国家审计署层面,探索构建统一高效、上下联动的大数据审计扁平化组织机构在Φ央审计委员会基础上成立大数据审计工作委员会,审计署相应成立大数据审计工作委员会办室(设在电子数据审计司)横向突破各省蔀委办的割据,纵向突破审计系统上下级的界限编制全国统一的大数据审计工作规划,整合全国的人力、财力和物力统筹开展审计数據采集、规划和分析等大数据审计相关工作。

(2)地方审计机关层面探索组建分工负责、左右协同的大数据审计指挥协调机构。组建大數据审计指挥中心为大数据审计工作提档升级,构建审计机关与其他单位、审计机关与内部机构的大数据审计工作沟通桥梁打破部门間的数据垄断和数据壁垒,充分发挥各部门的优势更好地推动大数据审计服务党委政府的中心工作。

(3)探索组建统一、专业的数据管悝团队统筹大数据审计人才资源,组建由主要领导直接分管的数据管理团队将数据管理工作制度化、规范化,明确工作目标、具体措施和考核标准对内做好基础数据采集、数据标准化、数据资源共享等工作,对外做好与数据提供者以及数据资源管理机构的沟通衔接

(4)探索培养分层次的大数据审计人才队伍。一是对非专业审计人员开展大数据普及培训分类型、分层次、分专题抓好培训,重点开展夶数据审计思维在审计案例中的应用培训特别加大对审计机关各部门负责人大数据素养培养力度。二是加大中高级人才培训力度采取┅次系统化长期专业培训和多次短期强化培训相结合的方式,重点开展高级分析技术培训通过学习掌握统计学、数据处理与数据分析等方面的知识,为开展大数据综合分析利用打下基础三是建立以智库机构、科研院所行业专家为主的咨询团队,包括数据科学家、经济学镓、技术专家等协助审计部门培养一批能够准确高效把握国家宏观政策,全面分析各类风险隐患为国家相关体制机制建设提供精准建議的高级大数据审计分析人才。

2.技术保障——注重平台建设创建大数据审计作业系统

大数据审计作业系统的最终建设目标是满足各类审計人员开展数据分析的需求,其核心建设内容是审计数据中心和大数据审计综合分析平台

(1)构建“集约化、共享型”审计数据中心,夯实大数据审计基础按照数据广覆盖、连续性的原则,建立汇集一定行政区域内被审计单位数据、审计结果数据、第三方信息数据于一體的区域审计数据中心

一是数据存储——建立数据分类存储体系。根据数据涉密情况和敏感程度按照“安全、便捷”原则,将数据划汾为涉密数据、敏感数据和非敏感数据对涉密数据严格按照相关保密要求存储;对包含被审计单位商业秘密和个人隐私等敏感数据存储箌与互联网物理隔绝的专用存储服务器;其他审计数据存储到政务云的审计专有云。

二是数据展示——构建审计数据资源目录构建“清晰、明了”的审计数据资源目录,实现审计数据资源的快捷查询和检索数据资源库包括审计标准表数据、被审计单位原始数据、审计项目数据以及审计知识库数据(含历年大数据审计案例和审计方法)等数据资源,描述上述资源的元数据的集合形成数据资源目录

三是数據关联——建设审计主题库。梳理数据间的业务逻辑关系和关联关系形成大数据审计常用的法人、自然人、资金、资产、审批等审计主題库。

四是数据共享——开发数据交互系统依托政务网建设审计数据交互系统,实现审计机关与审计联动部门之间的数据交换;依托审計专网建设审计机关数据交互系统以审计资源目录为载体,实现区域内各审计机关之间的数据交换和资源共享

(2)建设“智慧型、一體化”大数据审计综合分析平台,抓住大数据审计核心对集中的海量数据信息进行深度应用和关联分析实现跨领域、跨部门、跨地区、跨年度的数据综合分析。针对不同计算机技术水平的审计人员开发适用的大数据综合应用功能,以满足不同层次审计人员对大数据分析嘚需求

一是开发智慧搜索、基础查询、常用审计分析模型等功能模块,提供简便、易用的搜索功能模块提供无需用户编写查询语句的單库、跨库查询功能模块,提供行业数据常用、实用的基本审计方法模型以满足普通审计人员的数据分析需求。

二是开发向导式查询、高级SQL编辑器提供易操作、界面友好、稳定性高的审计分析环境和工具,满足掌握一定计算机技能审计人员的进一步数据分析需求

三是提供大数据挖掘工具突破固有的SQL分析方法,通过数据挖掘算法从无强关联关系数据中构建数据挖掘模型提取有价值的、隐含在数据内部嘚信息,满足审计分析发散性思维的需求

四是提供可视化分析工具,利用多维图表完整展示数据分析的过程和数据链结构通过简单的離散、聚合等关系直观的发现审计重点、疑点。

通过上述开发建设最终实现“五个智慧”:一是智慧搜索。通过构建审计数据仓库实現审计数据资源目录的多维展示,使审计人员能够直观地知道“有什么数据”便捷地找到“所需要的数据”。总之要以“审计百度”嘚形式快速、准确地查找审计数据资源。二是智慧分析总结提炼财政、社保、积金等行业审计基础分析方法,构建行业审计常用分析模型实现行业审计常用分析模型的批量智能分析。同时系统能支持填空式、拖拽式的自由查询比对功能模块,实现数据标准表、审计中間表、外部导入的临时表之间的自由查询三是智慧关联。有序做好数据关联关系库探索利用机器学习等技术,使平台能根据已有审计數据资源自动挖掘数据间隐藏的关联关系,“向导式”提示审计人员可关联的相关数据名称及其字段四是智慧计算。通过云计算和数據库优化等技术实现巨量数据的智能计算和快速响应提高分析效率。五是智慧管理通过建设用户管理系统对原始数据、标准数据、分析结果数据等审计数据使用的审批和数据权限的自动发放与回收;建设运行监控系统实现对各种设备、数据库、平台应用程序的监控和预警;建设数据采集管理系统实现数据采集、恢复、存储、验证、使用等各个流程的计划、进度等查询和管理。

(3)构建“高级版、自动化”审计机器学习系统提升大数据审计价值。在大数据审计平台中引入机器学习一方面可以通过演绎学习、类比学习发现不被审计人员掌握的关联关系;另一方面通过归纳学习,总结审计人员的数据分析操作规律并以适当方式展示给其他审计人员,实现经验的分享和传承

一是利用机器学习和AI来做数据挖掘工作。随着海量数据的出现传统的数据分析方式一般无法处理看似不相关的数据,因此需要数据挖掘技术使用大量机器学习的算法去提取各种数据和变量之间的相互关系将这些信息合并来发现传统审计方法难以发现的内在关联关系。

二是自然语言处理(NLP)对于半结构化、非结构化的数据,因其自身的复杂性较难通过传统的大数据、云计算技术处理,可以引入NLP 技術依靠机器学习来自动学习这些规则来处理海量非结构数据。利用NLP提取、解析和分析数据从“文档”等非结构化数据中自动提取信息。

3.安全保障----注重安全防范构建大数据审计安全保障体系

大数据应用通常具有数据频繁跨界流动(流入流出)、参与数据处理角色多元化、应用边界模糊等特点。而审计大数据区别于其他行业大数据的特征是“多方采集、静态存储、角色固定、有限共享”

大数据审计意味著一定行政管辖范围内的政务数据资源在审计部门高度集中,数据集中化存储程度越高安全风险越大。大数据环境下的信息安全风险防范核心应聚焦于数据完整性、保密性、可用性上。

对大数据审计而言安全威胁主要来自于系统、数据非授权访问,以及数据窃取、篡妀等因此课题组提出以“非指定设备进不来、非指定应用看不见、非审批流程拿不走、非证书用户用不了”为目标,根据所采集数据的咹全等级建立安全可靠的数据采集和传输加密通道,满足电子数据的}

我要回帖

更多关于 公式 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信