打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
统计智慧
原创:李金昌 未一统计 今天

    前不久,微信上盛传华为老总任正非接受采访时谈到的关于统计学的看法,大意是统计学很重要,人工智能就是计算机加统计学,任何专业都与统计学有关。联想到诺贝尔经济学奖获得者ThomasJ.Sargent关于人工智能就是统计学的观点,以及C.R.劳的“在理性的基础上,所有的判断都是统计学”的论断,还有西内启的“统计学是最牛的学问”的论述,我脑子里突然冒出一个词——统计智慧。潜台词是:人工职能体现的主要就是统计智慧,如果没有统计智慧,人工智能就可能啥都不是;同样,如果没有统计智慧,人类就不会有今天这样的思维能力;如果没有统计智慧,科技与经济就不会达到今天这个程度。那么,什么是统计智慧?在这里谈点粗浅的认识。

       C.R.的启发,我曾经在以往的论著中表达过这样一个观点:统计学是关于一切学问的学问,理由是统计学即政治加算术、哲学加数学和数据加方法。就政治加算术而言,统计学不是一般的加减乘除运算之术,而是通过数据计算和分析去满足政治需要的学科。尽管威廉.配第《政治算术》中的政治当时是指满足英国统治者的需要,但如今无疑已扩展到满足人类的一切需要,也即统计学已发展成为能满足人类一切需要的算术。就哲学加数学而言,统计学既是定量的哲学,又是定性的数学,既具有哲学思维,又具有数学思维,它能帮助人类开展定性与定量相结合的数据分析,给出最可能而非唯一的、有现实意义(定性)的定量结论,从而实现满足人类一切需要这个目的。而哲学是关于一切科学的科学,数学是关于一切科学的基础,因此作为哲学与数学之和的统计学自然就非同一般了。就数据加方法而言,统计学是研究如何对客观数据进行定性与定量相结合分析的方法论科学,而数据来自于各个方面、涵盖一切领域,所以统计方法就既包括通用的一般方法又包括各个领域特有的方法,能对一切数据开展有效的统计分析。基于此,我们就有可能通过数据收集和分析去发现事物真相、揭示客观真理。我想,统计智慧就在这里——让数据说真话。

 首先,统计智慧表现在能把零星分散的个体数据综合成为反映总体特征的综合数据。统计研究的基本特征是总体性、数量性和差异性,而总体性是基础。获取事物整体性或全局性的定量结论,是人类认识事物最基本但又不容易实现的要求。我们为什么要搞人口普查和经济普查?为什么要对规上企业实行统计报表制度、对其他企业进行抽样调查?为什么要搞住户调查?目的绝不是仅仅为了获得住户、个人和企业的有关数据,最终目的是为了掌握人口整体情况、经济总体状况、企业基本经营和居民一般收支水平等综合数量特征。从住户、个人、企业等个体数据到成为相关综合数据的过程,就是一个综合测度的过程,是统计最基本而又最能凸显智慧的过程,它包括获取什么样的数据,如何获取数据,如何分组、汇总和计算数据,怎样处理缺失数据,怎样检验和甄别数据,怎样进行必要的估计和推算,如何确定数据口径和统计标准,如何评估有关误差等方面。这些方面的任何其中一个都不简单,绝非有些人认为的那样只是简单的加加减减计算而已,因为这里面首先要解决为什么要加加减减、对谁加加减减、如何加加减减等问题,而解决这些问题靠的就是统计智慧。我认为,国民经济核算最能体现这样的统计智慧,因为没有比GDP更综合的数据了。如今,GDP几乎人人皆知其名,但很多人未必知其实。在很多人眼里,GDP不就是根据各种来源的数据加加减减得出来的吗?确实从计算上看它没有什么难度,不需要什么模型,但它首先要解决什么是生产活动、什么是最终产品和劳务、什么是中间投入、如何计价等问题,而这些问题的难度之大绝非数学模型所能比拟和表达的,否则国民核算方法无需历经了半个多世纪还要进行多次修订。但统计学凭借其总体数量关系把握的能力,通过指标定义、测度、分组、汇总、平衡推算等手段,可以分别从生产法、收入法和支出法三个方面给出GDP的数据。从散布在各地的生产经营活动到一个国家或地区的GDP综合数据,难道还不能体现统计的智慧吗?

 在这里,不得不重点突出一下统计指标的作用,因为如果没有统计指标,统计测度就没有依据,国民经济核算就成为一句空话。统计指标是反映现象总体数量特征的概念及其数值,其根本作用就在于把抽象的理论范畴转化为可量化的概念,从而使统计测度有了时间、空间、计算口径和计算方法、计量单位等依据,使一步步的数据综合成为可能。所以,我们平常所接触到的各种各样的总量指标、平均指标和相对指标,尽管大都通熟易懂,但任何一个指标的形成都非易事,都是在反复的理论梳理和实践总结基础上提炼和概括出来的。所以可以说,任何一个科学的统计指标都蕴含着光辉的统计智慧,GDP这样的指标更是毋庸置疑。在大数据时代,如何对非结构化数据进行有效的分析,形成综合性的定量结论,关键和难点依然是测度问题。不解决小数据的测度问题,综合就无从谈起,大数据分析也是一句空话。因此,大数据分析依然需要从科学定义统计指标(或变量)着手。此外,统计图表也很能体现统计智慧,一张分组表、一幅直方图或曲线图或雷达图,就能使繁杂的统计数据变得简单明白,同时也变得生动有趣。如今大数据分析中的可视化,无非就是统计图表思想的升华体现。

 其次,统计智慧表现在能从数据分析中发现规律、找出关系和判断趋势。如果说借助统计指标、用综合数据去体现和反映所研究事物某一方面的特征是统计研究的基本功能,那么从一系列数据中去发现规律、找出关系和判断趋势则是统计研究的根本任务,也是体现统计智慧最灵活最独特之处。统计研究的生命力就在于用统计规律去接近事物发展的真实规律(总体分布规律、量变质变规律、长期发展规律等),用统计关系去揭示事物间的真实关系(相关关系与因果关系),用统计趋势去预测事物的发展趋势(线性趋势与非线性趋势,平稳趋势与突变趋势等)。然而,由于事物发展的不确定性以及所掌握数据的局限性,要实现上述任务上帝都感到害怕!因为,如何解读所研究事物的历史背景和现实背景,选用什么样的数据,运用什么样的方法和模型,怎样控制误差,怎样解释定量结论等等,每一步、每一个环节都来不得半点马虎。其中可能遇到的困难和问题通常都是难以事先预料的,都需要运用独到的统计思维和科学的统计方法去灵活而有效地加以解决。特别地,寻找真实的因果关系恐怕是所有学科共同关注的焦点,因为它是如此之难从而极具挑战性,否则德谟克利特就不会立志“与其波斯国王,还不如找到一种因果关系”。我认为,世界上不存在无因果关系的关系,只是我们没有发现而已,舍恩伯格所说的大数据时代“只需关注相关关系”的观点是站不住脚的。事实上,人工智能和大数据研究的方向之一恰恰就是寻找各种因果关系。当然,不同的学科用不同的方法去寻找因果关系,统计学的方法是基于数据又透过数据、超越数据去寻找事物的因果关系,所以更理性、更客观从而更有说服力。但透过数据、超越数据并不容易,这就需要独特的统计智慧。人工智能和大数据研究因果关系,其实也离不开这样的统计思维,因为它的基础也是数据——更广泛、更多元、更复杂的大数据,瓶颈同样在于如何解读和透过数据。此外,及早预知事物未来发展趋势,也是人类始终的命题之一,古人占卜算卦体现的就是这种诉求,但统计学的方法依然是基于数据又透过数据去预测事物发展趋势,用数据告诉未来,结论是可选择的,从而更理性、更科学。同样,如今大数据和人工智能所构建的预测模型,所采用的思维也是统计思维,但算法更优化了。

 总之,统计智慧就是运用辩证思想,从定性与定量相结合中给出最可能接近事物真相的答案,用数据去解决连上帝都为难的如何认识不确定性事物的问题,为人类决策提供科学的定量依据。

  (已刊登于《中国统计》2019年第4期)

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
统计学是人类无能为力下的努力
统计学和计量经济学的神奇?(转载)_冷静的疯子
你知道回归分析的本质是什么吗?别稀里糊涂做回归分析了!
大数据时代,传统统计学有哪些变革?
统计学傻瓜指南
方法赏析:《人文地理学进展》定量研究方法第二弹之“推断”
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服