大数据应用已经在风控君所在单位如火如荼的开展起来,建立大数据思维、建设大数据应用、开发大数据产品成为最近一段时间的主要工作任务,风控君也要负责一项具体工作,为此,更需要抓紧时间学习大数据思维,更需要抓紧时间实践大数据模型。再加之,繁重的审计任务在身,最近的时间真是不够用了。
今天与大家分享一个好东西:指数。风控君所说的指数是统一学意义上的,也可以称为“统计指数”。有些朋友具有数理分析的背景,一定觉得这个概念真是老掉牙了,一点不新,有啥好说的。确实,与其他新颖的概念相比,统计指数是爷爷辈了。但是,风控君想说,在大数据的环境下,指数将焕发新的光彩,何况税务系统内,成熟的指数模型也是不多见的。
网络上将指数化思维定义为将衡量一个问题的多个因素分别量化后,组合成一个综合指数(降维),来持续追踪的方式。在诸多思维中,指数化思维是一个实践性的思维模式,绝对重要。
所谓指数就是把多个指标压缩为单个指标。指数化的好处非常明显,一是减少了指标,使得管理者精力更为集中;二是指数化的指标往往都提高了数据的信度和效度;三是指数能长期使用且便于理解。
指数化的三个关键点:一是要遵循独立和穷尽的原则;二是要注意各指标的单位,尽量做标准化来消除单位的影响;三是权重和需要等于1。
风控君认为设计指数模型时的最大难点:
一是与主题相关的穷尽;
二是诸多量化指标的设计;
三是指数组合和权重算法(建模);
四是数据采集和数据清洗;
五是模型验证和参数调整。
总指数的编制形式一般有两种,一是综合指数,二是平均指数。这两种计算方式分别根据不同的逻辑进行计算,相互间既有联系,也有区别。其中综合指数是总指数的基本形式,是根据客观现象之间的内在联系,先确定与研究现象有关的同度量因素,把不能直接相加的现象数值转化为可以加总的价值形态总量,再将两个不同时期的总量指标进行综合对比得到相应的相对指标,以测定所研究现象数量的变动程度。
综合指数
综合指数(Aggregative index)是用综合法对总体各部分数值来进行对比而计算的指数,用以反映总体动态变化。其主要特点是通过对不同时期的两个总量指标的对比以反映现象的动态变化。在指数发展历史过程中,最初产生的是简单综合指数(Simple aggregative index)。今天,简单综合指数已被加权综合指数(Weighted aggregative index)代替。
指数体系
指数体系是因素分析的基础。因素分析是在定性分析的基础上,依据指数体系中各指数间的联系,分别分析各因素对研究对象在数量上的影响程度及绝对量。具体分析的角度有多种:分析的对象可以是简单现象,也可以是复杂现象;分析的指标可以是总量指标,亦可以是平均指标;分析因素的个数可以是两因素,还可以是多因素。选择哪种角度进行分析,应根据分析的目的来确定。
经济现象都是在相互联系中存在和发展的,每一现象的变动都受到其他因素的影响和制约,这种相互联系、相互影响的关系,在许多经济指标之间也反映出来。例如:工业总产值的变动受工业产品价格和工业品产量两个因素的影响;产品生产费用的变动受单位产品成本及产品数量两个因素的影响;商品销售额的变动受单位商品销售价格与销售量两个因素的影响等等。这些因素之间的联系可以通过指标之间的经济关系式反映出来:
工业总产值=单位产品出厂价格×工业产品产量
产品生产费用=单位产品成本×产品数量
商品销售额=单位商品销售价格×销售量
以上关系式反映经济指标之间客观的经济联系,这种联系在应用指数进行动态变化分析时也应被保持下来,即:
工业总产值指数=工业品出厂价格指数×工业品产量指数
产品生产费用指数=产品成本指数×产量指数
商品销售额指数=销售价格指数×销售量指数
以上是指数体系中常用的两种形式。在许多指数之间都存在着与此类似的联系形式。因此,通过若干个相互联系的指数以分析经济指标的动态,这样组成的相互联系的指数形式就是指数体系(Index system)。
指数体系的主要作用
第一,分析总量指标动态变化中各个因素指数的作用和影响程度。
第二,根据指数体系推算指数。
第三,分析平均指标的动态变化及其结构变动的影响。
联系客服