大数据领域最为常见的应用场景就是关联分析,著名的购物篮分析就是典型的例子。
互联网在为我们带来便利的同时,也让数据来源获取的便捷度大幅提高,于是就有了大数据分析。大数据的一个重要原则就是先不管因果关系,只管根据大量数据挖掘出来的现象。这种特性实际上不是西方人的思维逻辑,传统西方思维讲究的是因果、确定性。
中国的传统思维方式,恰恰是以归纳总结为主,非常符合大数据挖掘的行事风格。所以,中国传统的五行生克关系,就非常适合做为关联分析的模型了。
基于五行生克的中国风关联分析模型
假定有两件事情A和B,我们要证明A对于B是很重要的,A会影响B,且A对与B有正向作用,但是又拿不出有效的证据,也不知道在什么情况下,这个结论成立。
这种情况下就可以用五行生克的关联分析,具体步骤如下:
【第一步】确定B
先随便把B比作五行的某一个元素,比如:金。
【第二步】确定A
1、根据题主的信息:“A影响B,很重要的作用”,可以推出是对B直接产生作用,直接作用B(金)的元素有两个:要么是生B(金)的土,要么是克B(金)的火;
2、“A对B是正向作用“,就是A生B,土生金,所以,A就是土;
确定A和B
【第三步】关联论证A对B的关系
回到你的问题,你一定是无法直接从A推出对B的这种重要直接的正向作用,现在套进五行生克的模型,明确了B代表金,A代表土。你只需要找出其他三个元素水、木、火的符合确定A和B的五行模型的关系,就可以证明A对B的关系,步骤如下:
1、找出C因素代表水,C的特性必须是直接消耗B(金)也就是为B直接正向作用、且直接受制于A(土),结果可能不唯一,全部穷尽列出来作为一个集合arrC{C1,C2,...Cn};
如果连一个符合条件的因素C都找不出来,则说明证明失败,后续步骤终止。
2、根据集合arrC里面的元素C1,联合B和A,再找出D因素代表木,D的特性必须是直接消耗C1(水)、且直接受制于B(金)、且直接克制A(土),如果结果不唯一,穷尽为一个集合arrC1D{D1,D2,...Dn};
2-1、如果没有符合条件的D,则终止arrC1D;
2-2、arrC1D完成后,继续arrABC2D{...};
3、最后再根据ABC1D1,找出E(火)的集合,E的特性必须是直接消耗D1、且直接受制于C1、且直接克制B、且直接被A消耗。同样是会形成集合。
4、最后如果上述步骤可以有符合条件的组合,越多,越证明A对B的关系是真实存在的。
基于五行生克的关联分析模型
这里是从原理上进行穷尽,软件算法需要这样去实现,所以看起来组合的情况会比较多,但实际生活中,符合条件的5个因素+10种影响关系的组合不会太多。
这种方法可以用于分析A是否会导致B的核心因素,在什么条件下会导致B。
联系客服