打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
数据的力量

  今年五月份购买的《大数据》一书总算是慢慢悠悠地看完了。这是一本有趣的书籍,通过政治、经济的博弈对数据进行了生动的描述。
  “我们正在进入一个新的世界,在这里,数据可能比软件还要重要。”(蒂姆·奥莱理,奥莱理媒体创始人、技术活动家,2007年)
  所谓数据开放,对应的是数据屏蔽。通过“信息自由法”,似乎让我们有理由相信数据开放的必然性。
  不过,数据是一种奇怪的东西,诚如《统计数据会撒谎》一书中提到“有 3 种谎言;谎言,糟糕透顶的谎言和统计资料”(Disraeli)。
  于是我看到了最小数据集的诞生,然后信息管理系统的兴起。
  在数据搜集阶段这是很有必要的,与之相关的则是元数据,继而语义网。
  之前在信息组织上接触过元数据、本体、语义网等,可以理解成如下模式:构建本体乃定义各种元数据的属性,元数据整合成各类数据,数据按照统一的标准发布于语义网上,用于智能检索。
  苛求的是,我们对于发布的信息——合成有意义的数据——有着更多的要求。数据可视化似乎正在上演一场好戏。
  当越来越多的信息,或以rss等干净的模式呈现,或以图表等“性感”的姿态出世。我们开始呐喊,“原始数据,现在就要!”(蒂姆·伯纳斯-李,万维网之父,2009年2月3日在TED大会上的演讲)
  因为现在的信息太过于庞大,甚至曲解。《信息烟尘···· Data Smog》中提到“尽管信息革命创造了诸多奇迹,但是一股黑压压的‘信息烟尘’已经飘了过来”。“信噪比”的概念不断蔓延。
  不过,我们不得不面对的是“数据背后的‘政经战争’”。
  当然,这一点在中国尤为明显。
  中国从数据搜集、数据使用,数据发布上都存在着一定的问题,或与国民的“数据意识”(不妨称之为“信息素养”)有关,或与政经博弈有关。
  可以尝试性地预见,中国是一个大数据源,其中的数据搜集、挖掘、分析,都存在着极大的提升空间。这一点可以从书中提到的图表“全世界大数据的分布”得到印证。
  所以,不妨猜想:未来20年内,政务信息的公开将是一个重要的话题。与之相连的搜集、挖掘、整理、发布都会是热点。
  推而广之,公共领域的信息将率先得到关注。
  当然,现实的“信息时态”不容乐观,不论是网络上的言论限制,还是线下的政策法案。
  但是,对于这个浪潮,中国还可以逆势而为吗?
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
中国古代十大最美丽的谎言
语义网
传播和抽样
W3C RDF 活动 | 菜鸟教程
语义网系列(1)--什么是语义网
面试中识别谎言的技巧
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服