在审计论坛或审计微信群中,经常有人问“第一次检查XX业务,该如何查?”、“从来没有做过XX业务,怎么进行检查?”等类似的问题。
这样的问题无论是审计新手还是审计老法师,在审计生涯中都会一直遇到,该如何破呢?
“太阳底下没有新鲜事”,审计过程中遇到的问题,在审计人员过去的经历或其他领域也许早就有了答案。
迁移学习(Transfer Learning)是大数据时代机器学习领域的一个术语。
在迁移学习技术应用之前,机器学习与内部审计人员面对一个新领域面临的困境非常相似:
解决如上问题的迁移学习,就是指通过两个领域之间的相似性、共性,进行举一反三,把模型从一个场景迁移到另外一个场景的动作,其核心技术是建立不同领域之间的桥梁,从而实现知识和技能的跨领域转移。
从迁移学习的实现过程看,迁移学习就是在已有知识或者技能的基础上,通过知识迁移,更加高效地解决当前问题。
迁移学习是大数据时代出现的术语,但它来源于人类自身。
因为人类天生具有跨领域迁移知识能力,简单的例子,开过摩托车的人学驾照比别人更快,这个能力就是迁移学习能力。
迁移学习实际上是人类遇到新问题时本能反应:
潘剑寒(2019)提出由于不同领域、不同学习之间的相同之处与不同之处是进行知识迁移以及技术迁移的核心要素,因此我们需要分析不同领域间的共性与特性,并以此为基础构建精确的迁移学习模型,从而实现迁移学习。
成甲(2019)也提出类似观点,任何一门学科都是为了解决某些问题而发展起来的,这些看似不同的学科,背后其实都会遇到相似的基本问题,只要我们能看到不同领域的相似问题,就能把跨学科的有效策略联系起来。
因此,迁移学习的核心就是用基本问题寻找相似性。
图源:《好好思考》
成甲在《好好思考-如何练就高超学习力》一书中提出一个问题:
“请问时装业、快餐业、半导体产业和香蕉业这四个行业有什么联系?
”
这个问题有助于思考如何进行迁移学习,大家可以在留言中给出自己的答案。
在内部审计工作中,提高迁移学习能力,善于进行迁移学习很重要,只有不断通过“已知”发现“未知”,才能不断开疆拓土,走在风险管理的前沿。
内部审计人员在迁移学习过程中,可重点关注如下三个方面:
审计人员要善于利用人类天生具有的跨领域迁移知识的能力,构建“T”型能力体系,借鉴其他领域的成果解决当前的问题。
审计人员除了需要掌握业务和技术之外(“T”的一竖,某个领域的深耕),还可以花时间涉猎一些貌似和专业不相关领域的书籍和资料(“T”的一横,多个领域的涉猎)。
比如,行业的发展有先后,内部审计作为管理后置环节,大多数时候都是处于尾随状态。也由此,生产、制造、销售等前置环节精炼出来的分析管理方法是可以通过迁移学习,应用到审计管理中。
以数字化审计为例。数字化审计只是数字化转型的一个子集,很多数字化审计中遇到的问题,在数字化转型过程中都已经遇到,并且得到了妥善的解决。
在数字化转型过程中,技术都是为了解决某些问题发展起来的,看似不同的技术路径后面,都曾经面对过相似的基本问题。提炼和学习解决这些基本问题的思维,能够极大地开拓我们的眼界和思路,应对不同的场景。
举个例子,互联网行业用于客户留存率分析的群组分析( Cohort Analysis ),换个视角可以用于内部审计过程中对财务资源投入的效益性分析。
在内部审计工作中,即便是常规审计,由于区域、客户和员工等差异性的存在,每次现场检查需要面对的实际上也是一个新的场景,这个时候就需要具有迁移能力,能够进行举一反三,将现有的模型从原有场景迁移到现有场景。
从机器学习的角度,迁移学习根据领域和空间特征的不同,可以分为同构和异构。
关注、收集和剖析同业出现的舞弊案例,对本公司的相关业务进行梳理和分析,是同构类型的迁移学习。
提炼操作风险分析和检查方法、思维,将其应用于市场风险的检查,是异构类型的迁移学习。
如果已知领域和未知领域之间相隔较远,不能直接建立“桥梁”,还可以通过多个领域的传递式迁移学习来实现目的,就好像踩着石头过河,一步步地走。
杨强(2020)举了一个传递式迁移的例子:斯坦福大学和世界银行一起合作,基于ImageNet数据集训练的模型,利用卫星图像来获得经济状况,尤其是贫困地区的经济状况。
这是个很好的传递式迁移的例子:通过将 ImageNet 的数据迁移到夜空图像,再通过夜空图像迁移到白天图像,经过这两步传递式迁移,就能自动得到一个对于卫星图像的二维图的经济状况的估算。
“ImageNet 是李飞飞博士牵头建设的,机器学习图像识别领域著名的数据集,该数据集有1400多万幅图片,涵盖2万多个类别,基于这个数据集识别猫猫狗狗、花花草草等的正确率已超过人类水平。
”
参考文献
联系客服