打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
2013年:世界“大数据元年”
2013年:世界“大数据元年”
2013-12-26 来源:深圳晚报  查看评论 

11月12日,美国政府公布新版大数据研究计划,白宫科技政策办公室主任霍尔德伦致辞说,他去年曾预测大数据将是件“大事”,现在来看保守了;因为“大数据现在已经成为天大的事”。

时间倒回到6月,斯诺登的41张幻灯片,让美国大数据监控项目“棱镜”浮出水面,令人不寒而栗。

对大数据时代的乐观和忧虑,在这一年充分展示。

1

大变革

“除了上帝,每个人都必须用数据说话。”不仅是人,整个世界都越来越数据化。信息革命深入发展,如潮的数据澎湃而至,数量之巨,种类之杂,来势之快,前所未有。

IDC(国际数据公司)估计,全球2012年产生数据总量约2.8泽字节。有人计算,这相当于3000多亿部时长2小时的高清电影,连着看7000多万年也看不完。

而这还只是序曲。更大的浪潮在后头。

IDC预测,未来几年,全球数据量每隔两年翻一番,2020年达到40泽字节。

大数据不单单是“数据的工业革命”,而是一场更深刻的科技和产业大变革的组成部分,是对未来大趋势、时代新特征的一种描述。大数据是推动这场大变革的重要动力,将成为促进经济社会转型新的关键资源。搜集、分析和运用指数级增长的庞大数据,将催生创新,为各行各业提供新的发展机遇,给人们日常生活带来改变。

星巴克有意推出的“大数据咖啡杯”就是个小小的例子。美国媒体报道,这家咖啡连锁巨头打算试验在一些咖啡杯中装上传感器,收集常客喝咖啡速度等数据,从而为喝咖啡较慢顾客提供保温效果好的杯子,提高其满意度和忠诚度。

业内人士认为,大数据的本质还不在于“大”,而是以崭新的思维和技术去分析海量数据,揭示其中隐藏的人类行为等模式,由此创造新产品和服务,或是预测未来趋势。

畅销书《大数据时代》的作者、英国牛津大学数据科学家舍恩伯格认为,大数据是一种新的价值观和方法论,人们面对的不再是随机样本而是全体数据,不是精确性而是混杂性,不是因果关系而是相关关系。

“现有的认知和体系是建立在稀缺数据上的成果,人们思维和工作方式必须发生变革以适应大数据时代的到来。”舍恩伯格在其书中写道。

2

大竞争

大数据被视为创新和生产力提升的下一个前沿,正成为国家竞争力的要素之一,在世界范围内日益受到重视。多国政府加大了对大数据发展的扶持力度,甚至上升到国家战略的高度。2013年,围绕大数据的国际竞争继续加码。

咨询公司益百利集团的研究显示,全球对大数据项目投资总额去年已达45亿欧元(约60亿美元),预计今明两年均会保持约40%的增长速度。

在美国,大数据已由热点词汇变成重点项目。去年3月,美国政府已公布2亿美元的《大数据研究发展计划》,今年11月再度公布涉及各级政府、私企、科研机构的多个大数据研究项目。美国国家卫生研究院、国家科学基金会等都参与其中,有评论称之为美国大数据战略2.0版。

在英国,虽然经济不景气、财政紧缩,但政府依然为大数据一掷千金。2013年初,英国商业、创新和技能部宣布将注资8亿英镑发展8类高新技术,其中1.89亿英镑(约3亿美元)用于大数据项目。

大数据在中国也已启动驶入“快车道”,政府、企业和科研院所正多方位布局。工信部的物联网“十二五”发展规划,将信息处理技术作为四项关键创新技术工程之一,其中包括海量数据存储、数据挖掘等。随着4G牌照在2013年末的发放,更高速的网络将带来更大的数据流,为政府和企业带来战略性资源。

3

大挑战

“棱镜”今年曝光,让人看到大数据时代维护国家信息安全、保护个人隐私所面临的严峻挑战。

“棱镜门”让各国政府意识到“数据主权”的重要性,以及在网络和电信核心技术上依赖个别国家的恶果。必须加快自主创新以保护“数据主权”,已成为一些国家的共识。

英国《自然》杂志3月刊登的研究发现,只要有4个时间点和位置的数据就能确定一个人身份,准确率高达95%。这表明,大数据足以将一个人“描画”清晰,现有法律手段和核心技术对个人隐私的保护正在逐渐失效。

如何在大数据来袭中保持清醒和理性、有所创新和创造,对国家和个人来说同样是考验。

专家指出,大数据可望为中国经济转型升级发挥重要贡献,巨大的人口基数、经济体量和需求,意味着中国发展大数据拥有得天独厚的优势。但也应该看到,大数据具有价值密度低的特性,挖掘、分析等技术要求高。中国不能仅满足于做“世界数据中心”,应防止概念炒作,加强自主创新,进行前瞻性的制度设计等布局,顺势而为,将“中国创造”由机遇化为现实。

还应该警惕“迷信”大数据等倾向,认识到大数据分析可能存在的缺陷和不足。心理学家认为,大数据创造的模型会将人束缚在算法提供的选项中,过度依赖大数据分析也可能束缚创新。美国互联网活动家帕里泽称之为“互联网滤泡”:互联网个性化虽然带来方便,却将人们局限在自己过往行为模式的“气泡”中,无法触及海量信息带来的无尽可能。

大数据专家喜欢用莎士比亚“凡是过去,皆为序曲”来形容大数据分析的必然,但大数据提供的也只是参考答案而非最终答案。无论在小数据时代还是大数据时代,探索和创新精神都不应放弃,正如林肯所言,“预测未来最好的方法就是去创造未来”。

4

大事件

美国防务承包商前雇员爱德华·斯诺登的爆料,让美国国家安全局的“棱镜”监视项目为大众窥知。如果单从技术角度看,“棱镜”可能是迄今最成功的大数据应用项目之一。

“棱镜”最大特点在于利用美国的全球通信中枢地位截取数据。斯诺登提供的一张幻灯片,如果从巴基斯坦发一封电子邮件到英国,从美国“绕道”更快捷经济。而当全球海量数据都如此“绕道”,美国情报机构只要在电信运营商的主干光纤上做手脚,就可以截取。

除了对互联网数据通路的操控,美国国家安全局在“9·11”之后还开始收集通话元数据,即不包含通话内容的美国境内及国际通话的双方电话号码、通话时长、电话的位置信息等。另据媒体披露,对于电子邮件、社交网络等加密内容,在一些互联网公司的合作下,国家安全局可以从这些公司的服务器将数据直接同步到自己的服务器上,运作过程同云端硬盘备份类似。

为了处理这些数据,国家安全局专门开发了一个数据库,可以储存处理多格式数据,在发现数据的规律模式后实时报告,并能将姓名、电话号码等元数据作为节点,把相关的姓名、号码、搜索词等联系起来,自动生成关联图。

“棱镜”还有一套名为“无限线人”的大数据分析工具,按国家和具体项目进行监视。使用者可以选择一个国家向系统提问“我们对X国掌握的最新数据是什么”,系统会显示掌握的元数据量,再根据具体项目显示细节数据。资料显示,2013年3月,“无限线人”在全球计算机网络收集信息基础上产生的报告达970亿条。

大变革

一种新的价值观和方法论,人们思维和工作方式必须转变以适应大数据时代

大竞争

大数据被视为创新和生产力提升的下一个前沿,成为国家竞争力的要素之一

大挑战

只要有4个时间点和位置的数据就能确定一个人身份,其准确率高达95%

新闻热词

大数据

据新华社电 按照业界比较普遍的看法,大数据具有海量、多种类、需要大规模处理和快速响应等特点。

根据IDC(国际数据公司)的跟踪分析,全球产生的数据总量2010年首次突破1泽(10的21次方)字节,2012年达到约2.8泽字节,2020年有望达到40泽字节。2012年,全球产生的数据中仅有约0.5%得到分析。到2020年,全球数据总量中有22%将来自中国。

从内容来看,这些海量数据可分为结构化和非结构化数据。问卷调查、产品评论、信用卡记录和实验结果等属于结构化数据,仅占数据总量的5%左右;大数据时代的数据量爆炸多来自非结构化数据,例如在社交网站上发布的照片和视频,在搜索引擎中输入的搜索词,手机产生的即时位置信息等,约占数据量的95%。

比如,世界上第一部“先拍照后对焦”光场相机Lytro,就运用了大数据处理分析理念。与传统相机只记录一束光不同,Lytro可以记录整个光场里所有的光,也就是用总体数据取代了随机样本。用户没必要一开始就对焦,想要什么样的照片可以在拍摄之后再决定。

数据量大幅增加对人们注重精确性的习惯等提出了挑战,大数据需要技术和思维上的变革才能利用。人工智能专家说,相关翻译在语料库使用庞杂的网络内容后取得了飞跃发展,不完整的句子、拼写错误、语法错误等各种错误;让翻译可以正确地推算出英文词汇搭配在一起的可能性,混杂性和谬误反而让翻译的表现以及产品更为突出。

以上内容来自:深圳晚报
[责任编辑:yf001]
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
大数据发展重要性及未来发展趋势
大数据变革路径
新基建之大数据 | 数字经济的“新鲜血液”,产业变革的“幕后英雄”
智能音箱没有衰退,创新加速周期已来
斯诺登:英国利用网络光纤监听通信 比美更恶劣
为什么说财务转型是企业数字化转型的基础?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服