打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
《数据之巅》数据承载的无限力量

《数据之巅》数据承载的无限力量

阳光心程 2016-06-27 13:55:41
 


 起初我以为,自己对于数据没有任何的兴趣的,因为想到数据,就会让我想到业绩,想要业绩,就会让我联想到,一心为业绩搏斗的人和时光。看完这本书,觉得自己好好笑,自己对数据的断章取义,对企业经营的断章取义,自己的目光短浅定义了自己在这方面的视野。

 花了一周时间,利用空余时间,坐火车的时间,有时候选择坐火车,就是因为坐火车能拥有连续的时间完全不被打断,这样可以阅读,写作,或者看些自己想看的视频,把书读完,有些地方不是很懂,然后,不断百度给自己补课,还有些知识依然不懂,我想就让它先这样,随着阅读和阅历的增长,以后慢慢就懂了。

 以下的一些事件和人物让我重新认识了数据的价值。

 数据,背后承载了一个时代的变迁,从最初的美国内战,谢尔曼将军利用肯尼迪提供的人口的普查的各项数据取得了战争的胜利。

   然后Margaret Mitchell写的《乱世佳人》大受众人的喜欢,新书上市,首发1万册,但迅速告罄,接下来几个月不断加印,一时洛阳纸贵。这本书的成功引起了好莱坞的关注。但这是一部以好莱坞为题材的的电影,在此之前,好莱坞出品的以南北战争为题材的电影步步亏本,没有任何一部赚钱,导演对于《乱世佳人》意见不统一。于是,好莱坞请盖洛普做一个调查,用数据来证明《乱世佳人》有多流行。通过调查,盖洛普非常肯定的告诉电影的制片人塞尔兹尼克,《乱世佳人》已经成为美国有史以来最流行的小说,共有1400万美国人读过这本书。但还没等到电影开机,制片人,剧组和发行商之间就电影时长、是否分为上下两集、黑白还是彩色、演员的选取和广告设计爆发了争议。于是,塞尔兹尼克委托盖洛普调查争议问题的方方面面。盖洛普调查出非常详细的数据得出:影片分为上下两集、时长238分钟、彩色、由费雯.丽担任女主角以及盖洛普最后给片方的结论是,这部影片将有5650万观众。最后,《乱世佳人》一共售出5997万张电影票,和预测的5650万张相距不到6%。凭借这种精确度,盖洛普也彻底的把数据带进了美国的电影行业。1940年,盖洛普成立了观众调查所专门为影视行业服务。

 除了盖洛普,还有一个人在数据方面对美国的经济发展功劳不小,他就是被后世誉为“质量管理之父”的爱德华兹·戴明。

 20世纪20年代,美国正在大规模普及电话,霍桑工厂有45000多名工人生产电话。工厂管理还完全遵循进步时代遗留的科学管理思想:计件制。戴明看到这种思想的指导下,车间内拥挤,沉闷,工人们一言不发,汗流雨下,如果有产品没有通过工头的检验,就会以扣发工资的方式进行惩罚。戴明反对计件制,他认为,这降低了生产的积极性,侵害了人的尊严,不利于提高产品质量。这个时候,工厂正在进行“霍桑实验”,进行了10年,最终也印证了戴明的发现,金钱不是提高工人积极性的唯一动力,人不仅仅是经济人,也是社会人,要调动每个人的积极性,还必须从社会,心理方面努力。

 1940年的人口普查工作,在戴明的参与下,不仅很多专项普查采取了抽样技术,统计方法也被应用到提高数据质量的领域。在珍珠港事件爆发不久,戴明接受了美国国防部的邀请,在军工企业讲授他利用统计控制质量的方法。两年期间,戴明一共为国防部培训了2000名工程师和质检员,美国也因此产生了第一批有质量控制意识的工程师。二战结束,戴明在质量控制领域小有名气。他辞掉政府的工作后成了一名独立咨询师,但他也因此坐上了冷板凳。因为他的质量在美国仅仅影响了一线工程师及质检人员,没有触及企业的高级管理人员。

 但戴明的思想却在日本得到了重视。二战后,日本处于恢复期。盟军总司令麦克阿瑟接管日本后,邀请戴明帮助日本开展战后的第一次人口普查,通过普查对战争给日本社会造成的破坏程度进行评估,为其经济规划提供数据支持。于是,这人口普查的过程中,戴明结识了不少日本朋友,也被日本统计协会聘为首位外籍荣誉会员。

 随着日本经济建设的铺开,工商届认识到,日本的粮食不能自给,若能扩大工业出口,就可以用外汇换取粮食,而要扩大出口,唯有改善产品质量,增强竞争力。但日本商品在国际上却恰恰以“山寨”,“低劣”而闻名。于是,在这样的背景下,戴明的名字,又被提及。

 戴明在1950年又收到日本科学与工程联盟即日工盟的邀请,这时候的他,心里知道要改变日本,就必须从日本的最高管理层入手,他向日工盟的主席石川一郎提出,他希望见到日本企业的最高管理层,而不是一线的工程师,于是,在石川一郎的安排下,戴明见到了日本的21位行业巨头。这21位行业巨头管理着日本近80%的财富。戴明直接告诉他们:“日本可以用高质量的产品换回粮食,5年内,日本的产品将占领整个国际市场,如果按他倡导的原则去做的话。那之后,戴明和日本的企业家频频会面,向他们讲述如何在企业中建立完整的质量管理体系。15年后,全世界目睹了日本开创的经济奇迹。

 再谈一下为什么日本会对一名远洋外国人言听计从呢?直接的原因是日本工商届在图谋破壁,迫切希望改善“日本制造”的不良形象,扩大产品出口,打造国际市场;同时,“二战”的惨败,日本自尊心受到极大的打击。除了这些之外,还有深刻的心理原因和历史原因。日本自从明治维新以来就有“脱亚入欧”的目标和梦想。“二战”彻底失败,1945年广岛事件,更让日本人深刻的体认到西方现代文明的先进与强大。在这种背景下,戴明被日本的工商界当作“先知”来对待,他们全心全意的贯彻他的主张。

 戴明的成功,还有另外一个重要的原因,即戴明的主张契合了日本文化注重细节的特点。戴明认为,85%的质量问题源于管理不当,而生产过程中之所以质量偏差,原因可以分为两种:一种是特殊原因,一种是共同原因。特殊原因是指源于某一特定人员,机器或者特定环境的影响,本质上是局部的,一旦一线生产人员采取合适的行为,就可消除;而共同原因是源于制度的缺失或整个系统的不精确,要由管理人员采取行动才可能缩小和纠正过来。

 日工盟在这时候也全面发挥了自己的组织协调功能,坚持在全国开展培训,普及戴明的方法和理论,1950—1970年,日工盟一共培训了14700名工程师和上万名管理人员。于是,数据和图标就像花朵一样,开始在日本的企业,工厂和车间的各个角落“绽放”。20世纪60年代,针对如何在生产过程中收集数据,日本学者又提出了系统的“质量管理7大手法”和“质量管理7大新工具”。这时候,世界质量管理的前沿和中心,已经毫无疑问的转移到了日本。

 1965年,戴明第7次访问日本,参加了第15届戴明奖的颁奖典礼,并受到日本天皇裕仁的接见。

 然而,戴明对日本的影响,这时候,美国却毫无所知。直到有一天,美国国家广播公司的制片人梅森,在华盛顿的一次采访中,听到一位教授说:“就在这附近,住着一位叫戴明的老人,他扭转了日本的经济。梅森眼睛一亮,第二天就找到了戴明,开始了她的采访。最后,她完成了这部长达1小时的纪录片,片名为“日本行,为什么我们不行”。这部纪录片瞬间轰动了美国。美国的企业从此开始追求质量,戴明很快成为通用,宝洁,福特,亨氏等一系列美国大公司的座上宾。这部纪录片的播出可以说是成为美国的转折点。

 现在,我们再来看看,美国数据对内开放的三个阶段。说到开放,大家可能首先会想到对外开放,而一个国家的开放,首先应该指向它的内部,涂子沛先生说,就开放程度而言,一个健康的国家,对内开放的程度应该远远高于对外开放的程度,也就是说,和外来的“人、财、物、信息”相比,内部的“人、财、物、信息”应该享有更高的自由度。

 美国对内开放的三个阶段分别是:

 内开放1.0:数据承载知情权。1953年,在新闻届的强烈要求下,国会开始草拟《信息自由法》,要求在不危害国家安全,不侵犯个人隐私的情况下,政府应该公开一切信息和文件。美国的《信息自由法》,其建立和完善,为内开放奠定了制度性的框架。但这个阶段,公开信息和数据的主要目的还仅仅是为了保护公民的知情权。

 内开放2.0:用数据制衡。这个新的转折点的出现,要从20世纪70年代兴起的环境保护运动说起。美国女性作家雷切尔.卡森(RAchel Carson)出版了《寂静的春天》一书,引发了大众对于环境污染问题的的关注。卡森说到,因为人类无节制的使用农药等化工用品,在春天到来的时候,再也听不到鸟儿的歌声了。书中第一次明确提到保护环境。这一年,美国诞生了第一个地球日,组建了国家环保局。但这时,美国的环保运动依然困难重重,原因在于,要采取措施保护环境,就意味着现有利益格局的调整,个别领域发展的停滞,行业利润的下降,甚至部分人员会失去工作。

 涂子沛先生分析,这正是环保运动的复杂之处:环保主义者高举正义的大旗,其他群体,尤其是利益受损的群体会认为其过于激进;而且,任何群众运动和社会运动都免不了鱼龙混杂,在美国的环保运动中,也曾出现一些企业,借环保之名打击商业竞争对手。在各种组织和势力的对抗中,政府就像是“三明治”中的火腿,被夹在中间,政策的制定者常常进退两难。

 在1984年,印度发生了一起恶性环境污染事故,导致3787人立即死亡,接下来几周又有上万人死亡,共有50万人因此受伤,史称博帕尔之灾(Bhopal Disaster)。其伤亡之惨烈震惊世界,在美国激起了新一轮的环保运动。1986年,美国国会通过立法,要求相关企业必须每年公开其排放到空气、水源或土壤中的有毒化学物品的数量。这部法律的出台,出人意料的获得了成功,而且成为美国信息公开的转折点。

 通过公开数据,把企业置于全社会的舆论和监督之下,使其自觉、自愿降低污染物质的排放量,矛盾得到转移,问题得到解决。通过这项法律,美国政府真真切切地领会到数据公开的制衡作用,意识到开放本身就是一种有效的管理手段。美国内开放由此进入2.0时代。

 在内开放的2.0时代,美国政府对“公开”的手段运用得越来越娴熟,把内开放的社会管理功能,市场调控功能发挥得淋漓尽致,除了在环境污染,在产品质量,食品卫生,药物安全等棘手的社会领域,都主动且大量地采用公开的方法。

 除了在经济、社会事务领域发挥作用,数据公开的这种制衡作用,还可以在美国体制中找到应用。例如,有一个问题在美国的历史上纠结已久,那就是,国会议员是否应当享有自由买卖股票的权利?国会的立法,重大事务的表决往往会引起股价的波动甚至震荡,如果允许议员自由买卖股票,议员就可能会利用自己掌握的信息闷声发大财,也可能在表决重大问题时顾及个人私利,投出不公正的一票。

 美国社会曾经为这个问题展开过多次的讨论。争来争去,发现最好的办法就是财产公开。财产公开的这种诉求,其实就是后来的“数据开放”的原型,2000年之后,数据公开的要求在美国社会逐渐转变为“数据开放”的呼吁,随着数据开放浪潮的到来,美国的内开放被赋予了新的目的和浓厚的技术色彩,并且上升了崭新的高度,这个新时代的拐点,既是“9.11”事件。

 2001年9月11日,早晨7点59分—10点28分之间,一架飞机突然从天而降,撞在了双子塔北塔楼92—99层,接下来又一架飞机撞向了世贸中心南塔楼第77层到第85层;然后第三架飞机撞向了美国国防部的五角大楼。很快,世贸中心南北双塔火势熊熊,浓烟滚滚,轰然倒塌的消息和照片便充斥了世界各地的电波和屏幕。报纸、电台、电视台都把镜头对准了世贸中心。在现场报道的第一时间,全世界的记者都开始估计死亡人数。准确的死亡人数当然还无法统计,但他们知道,随着大楼的倒塌,楼内的人员可能全部都会遇难。于是,问题演变为:在这个时间点上,世贸中心双子塔内究竟有多少人?在组织救援的过程当中,从在一线指挥的消防局局长到纽约市市长,再到高层的决策者如国防部部长、副总统。每个人都禁不住在第一时间发问:双子塔中究竟有多少人?

 前文提过,美国的人口普查是围绕个人住址,通过登门入户的调查展开的,其最后的结果是一个地区的居民数量。但居民,是晚上居住在这个地方的人,白天的某一时刻城市的某一个区域到底有多少人,是无法统计的。

 在悲剧现场的第一时间,国家的统计部门无法为最高的决策者提供准确的数据,这自然又成了普查部门的“数据”之痛。这被概括为“白日人口”(Daytime Population)统计问题。其中的困难并不在于统计的方法和技术,而源于不同政府之间的合作障碍。

 普查局不仅要掌握全国每一个人的年龄、种族、住址等个人信息,还要了解他们在哪个单位工作,而且要确定每一个单位的地址在哪里。要完成这项统计,就要对联邦政府和州政府多个部门的数据进行整合,因为涉及面大,美国又是联邦制国家,各州有其数据管理的法律体系,所以数据的整合难度相当大,“9.11”事件的悲痛现场推动了这个项目的进程,这个项目被命名为LEHD(工作单位和家庭住址的纵向动态系统)。要把人口普查的数据和全国公司的数据联通起来,这是一个真正的大数据项目。

 LEHD的真正强大之处,还在于其数据分析的粒度,它可以按地区、邮编、选区、学区、人口普查的片区等各层级单位对数据进行层层下钻,甚至连一个居民街区的人口情况都能分析出来。

 LEHD系统还有一个最大的特点,即提供以时间为跨度的纵向数据分析,这也是该系统被称为“纵向动态”的原因。

 LEHD系统的整合和开发,起初完全是为了供政府部门使用,但当数据整合完毕时,大家都意识到了这些数据的价值,那么该系统应不应该向大众开放?在美国内部引发了争议:一部分人认为,这些数据具备巨大的商业价值和研究价值,应该开放给全社会使用;另一部分人认为,如果把这部分数据公开,会让恐怖分子找点找得更准。到最后,“数据应该服务于民”的思想占上风。从2006年起,普查局为LEHD开发了一个基于地图的互动式界面——OnTheMap,把数据无偿提供给大众使用。

 当时争议的另外一个焦点,就是个人和商业的隐私问题。于是又使用了新的数据技术,即“人工合成数据”,其合成方法是,在掌握了全体数据统计特征的基础上,利用人为手段,产出一些统计特征和原始数据一样的人工数据,但在个体信息层面,那些敏感的数据字段都被虚拟的数值取代了,个体信息因此不会泄露。

 事实是,对于任何一个地区而言,它有多少个职位,多少个居民,每个季度,每年是否新增了工作机会,有多少人搬进搬出,这些变化的数据本身就是相当重要的经济发展指标。

 LEHD不断的推出新应用:公共应急管理。该应用整合了关于飓风、热带风暴、暴雨、洪水、暴雪、火山等恶劣天气,自然灾害及其他人为灾害的实时数据,这些数据来源于国家气象局、国家农业部、内务部、联邦应急管理局四个单位,数据定时更新,个别数据甚至每4小时更新一次。

 LEHD项目的开放式历史证明只是一个过渡,伴随着这一股新浪潮,美国的内开放进入了真正的3.0时代。

 内开放3.0时代:用数据推动创新。美国社会基于开放式数据产生得新软件,新应用可谓层出不穷。

 2013年5月9日,奥巴马签署行政命令《政府信息得默认形式就是开放并且机器可读》,把数据开放上升到了法规层面。他命令美国联邦政府全面开放数据,而且明确规定:未来的政府信息一经产生,其默认的形式就应该是开放的,机器可读的。这份命令的发布,标志着美国的内开放又上了一个新的台阶,迈进了3.0时代。在这个新时代,数据开放是为了改善人民生活,引领经济发展,推动社会创新。除了奥巴马领导的联邦政府,美国50个州中有39个州政府,44个地方政府都在近年内建立了数据的专门网站。

 美国开创的系列数据开放运动,很快就在全世界受到欢迎,形成一股世界性的浪潮。2011年9月,美国、英国、挪威、墨西哥、印度尼西亚、菲律宾、南非等8个国家共同发起了一个新的国际组织——开放政府联盟(OGP),该组织承诺要通过互相监督,共同努力来推动世界各国政府的信息公开和数据开放工作。开放政府联盟的呼吁,得到了很多国家的肯定和响应。自其成立以来,意大利、希腊、韩国、肯尼亚、秘鲁、阿根廷、蒙古等50多个国家陆续加盟。截止至2013年年底,该联盟从8个会员国扩大到63个会员国,其中有不少发展中国家。

 商业领域的数据开放,将减少市场运动中的信息不对称,鼓励正面的市场竞争,优化社会资源配置,降低社会运行成本。归根结底,在大数据时代,数据就是最重要的生产资料,数据在全社会的自由流动,就代表着生产资料的盘活、知识和创新的自由和流动,内开放3.0将催生人类历史上前所未有的开放社会。

 数据发展的历程就是这么奇妙。

 一周时间读完这本书,花了9小时把本书里最有吸引力的部分概括出来,大部分是涂子沛老师的文字,我用自己的理解把它整理出来,花了1个小时整理修改文字。想说,对数据或是经营管理兴趣的朋友,这本书一定会冲击你的大脑,帮助你刷新对数据体系的认识。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
【书评分享】数据·历史·文化
戴明奖简介
[历史故事] 偷师美国
半导体之战日本靠什么取胜
《管理百年》第二十五讲:W·爱德华兹·戴明(1900-1993)
PDCA管理循环
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服