打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
学界 | KDD 2016 演讲和论坛视频出炉:深度学习是一切问题的终极答案吗?

选自 Video Lectures

机器之心编译

参与:Terrence、吴攀

当地时间 8 月 13 到 17 日,第 22 届 ACM SIGKDD 数据挖掘及知识发现会议在美国旧金山举行。KDD 2016 是世界顶级的跨学科会议,汇集了来自数据科学、数据挖掘、知识发现、大规模数据分析和大数据领域的研究者和实践者。近日,KDD 2016 期间的一些演讲和研讨会视频陆续公开,机器之心对其进行了简单梳理,视频内容请查阅 http://videolectures.net/kdd2016_sanfrancisco/ 或 KDD 2016 Video YouTube 频道 https://www.youtube.com/channel/UCPsUUDUlcTJuP-fRa7z85aQ?app=desktop。

一、小组研讨会(Panel)

KDD 2016 的这个 Panel 有一个非常有意思的主题:「深度学习是新的终极答案吗?」研讨会主持人是谷歌杰出科学家、前雅虎 Computational Advertising 研究者兼副总裁 Andrei Broder。参与研讨的学者包括华盛顿大学计算机科学与工程副教授 Pedro Domingos、牛津大学计算机科学教授兼 Google DeepMind 研究科学家 Nando de Freitas、Clopinet 独立工程顾问 Isabelle Guyon、加州大学伯克利分校电气工程与计算机科学教授 Jitendra Malik、普渡大学计算机科学系副教授 Jennifer Neville。

深度学习是新的终极答案吗?(Is Deep Learning the New 42?)

主题介绍:深度学习的历史最早可以追溯到五十年之前,但在思想市场中它被意识到的价值却经历了高峰和低谷。我们在历史最高记录时都对此毫无疑问:在过去的几年中,我们见证了视觉、语音识别、游戏、翻译等领域的非同寻常的发展。同时,亚马逊、苹果、Facebook、微软这些公司正在深度学习研究和设施方面进行巨额投入。机器学习的竞争被深度学习方法主导,开源的深度学习软件正在快速增长,流行的媒体也在支持这个过程,同时也喂养着意外后果的黑暗幽灵。

所以深度学习会是所有问题的答案吗?

根据 Douglas Adams 著名的《银河系漫游指南》,在「深思(Deep Thought)」计算机经过了 750 万年的工作后,计算机直截了当地发现了 42 这个数字是:生命、宇宙以及一切事情的终极答案。(尽管不幸的是没有人确切知道这个答案的问题是什么。)

与其为了使「深思」可以回答我们的问题而再等上 750 万年,我们的这个小组谈论已经整合了一群杰出的专家,来为我们提供他们对于深度学习的观点和对现在和将来的影响。

二、主题演讲(Keynote Talks)

1.Graphons 和机器学习:稀疏大型网络的模型构建与估计(Graphons and Machine Learning: Modeling and Estimation of Sparse Massive Networks)

演讲者:Jennifer Chayes,微软研究院杰出科学家兼常务董事

主题介绍:有很多大型稀疏网络的例子,尤其是互联网、万维网和在线社交平台。我们应该如何对这些网络进行建模和学习呢?和传统的学习过程中遇到的问题相比(我们有很多不同的例子),我们经常只能从这些网络中得到一个独立的例子。我们怎样利用目前的一个单独的快照来学习网络的模型,并在未来预测一个更大的类似网络呢?对于小型或中型网络来说,我们应该以参数的形式为网络建模,并设法学习这些参数。对于大型网络来说,非参数的表征更为合适。在这个演讲中,我们会首先回顾下 graphons 理论,这个为描述稠密图(dense graphs)所开发的理论已经经历了十年的发展,最近的理论描述了具有不受限制的平均度的稀疏图,包括幂律图。我会展示怎样利用这些 graphons 作为稀疏网络的非参数模型。最后,我们将会展示怎样得到这些非参数模型的连续估计量,还有怎样用不侵犯网络中个体隐私的方法做到这些。

2. 人类、计算机和一堆乱七八糟的真实数据(People, Computers, and The Hot Mess of Real Data)

演讲者:Joseph M. Hellerstein,加州大学计算机科学 Jim Gray 教授

主题介绍:在实践中,端对端的数据分析基本上不是一个纯设计过程。获取数据是非常需要技巧的。数据评估、wrangling 和特征提取都是消耗时间并且主观的。过去用来驱动数据产品的模型和算法是高度情景化的,涉及到数据源、编码和应用需求的时变特性。理想地说,所有的这些可能会从组织视图中受益,但通常是由个体用户驱动的。

从历史角度来看,敏捷分析(agile analytics)和分析流程的建立都涉及到人与计算和基础设施之间的交互。在这份演讲中,我将会分享一些我们研究过程、用户研究、公司(Trifacta, Captricity)实践经验和一个新兴开源项目(Ground)当中的奇闻轶事。

3. 从 VC 视角来看机器学习领域的投资(A VC View of Investing in ML)

演讲者:Greg Papadopoulos,NEA 投资合伙人

主题介绍:我们正见证着一个跨市场和行业的数据科学应用的交汇处。算法进步、廉价的研发周期、在任何地方都可以获得网络数据,这个三大法宝无疑是一个催化剂。对许多人来说这个结果是对效率的持续提升,对一些人来说是关于每个行业的彻底重塑和颠覆。在这个演讲中,我们会给出在未来关注或投资的例子,然后重点介绍我们关于数据增值基础设施和应用端公司的生态系统观点。一个严重的问题是:这些在工具、技巧和教育方面数据整体优势是否真的会被转化成可以应用在任何地方的大众化功能。在未来我们会将机器学习当做一个商业领域,跟随它的价值并得出我们自己的预测。

4. 信息安全的进化的意义(The Evolving Meaning of Information Security)

演讲者:Whitfield Diffie,斯坦福大学安全与合作国际中心顾问学者、公钥加密概念的提出者之一

主题介绍:当你在研发安全系统的时候,作为对新的安全手段的回应,新的渗透技术似乎也会出现,但是总的来说,这股趋势将会反向:威胁的进化将成为安全的产生和进化的原因。从 20 世纪无线电的兴起开始,针对通信网络的攻击显现出了两种形式:一种是大屠杀(如对 Enigma 的破解),另一种是将一些看起来无伤大雅的信息泄漏聚集起来,形成一个对于目标行为的全面理解。

我们将会分析这些趋势和其他人进行互动的方式,这会创造出一种情景,在这个情景中,通信网络中关于安全的可能性,甚至是安全的意义都需要得到重新检验。

5. 使用深度循环神经网络学习去学习和组合性(Learning to learn and compositionality with deep recurrent neural networks)

演讲者:Nando de Freitas,牛津大学计算机科学教授兼 Google DeepMind 研究科学家

主题介绍:深度神经网络表征在计算机视觉、语音、计算语言学、机器人、强化学习和其他很多数据丰富的领域中发挥着重要的作用。这个演讲中,我会展示 learning-to-learn 和组合性是解决知识迁移的关键成分,从而可以解决小规模数据规制和持续学习中的问题。我会用三个例子来解释:学习学习算法(learning learning algorithms)、神经编程器和解读器(neural programmers and interpreters)、学习通信(learning communication)。

三、应用数据集科学特邀报告(Applied Data Science Invited Talks)

应用数据科学特邀报告为世界一流的专家提供了展示数据挖据和知识发现应用的场所。这些特邀报告都来自于在各自领域里都直接做出了成功的数据挖掘应用的极具影响力的演讲者。这些报告和讨论的关注重点是创新的、前沿的大规模的或政府的数据挖掘应用,涉及领域涵盖:金融、医疗、生物信息学、公共政策、基础设施、电信、社交媒体和计算广告。下面机器之心简单列出了这 11 个特邀报告的主题的演讲者,感兴趣的读者可访问前文提供的网址查看。

1. 你能教会大象跳舞吗?亦即:文化用数据科学当早餐(Can You Teach The Elephant To Dance? AKA: Culture Eats Data Science for Breakfast)

演讲者:Jonathan Becher,SAP 首席数据官兼数字业务负责人

2.Verizon 的大规模机器学习:理论和应用(Large Scale Machine Learning at Verizon: Theory and Applications)

演讲者:Jeff Stribling,Verizon Labs 产品管理部副主任

3. 计算社会科学:激动人心的进展和未来挑战(Computational Social Science: Exciting Progress and Future Challenges)

演讲者:Duncan Watts,微软研究院首席科学家,微软研究院纽约实验室创始成员

4. 贝叶斯优化和嵌入式学习系统(Bayesian Optimization and Embedded Learning Systems)

演讲者:Jeff Schneider,卡内基梅隆大学计算机科学学院教授

5. 大众的智慧:源自数百万数据科学工作流程的数据准备 & 机器学习的最佳实践(The Wisdom of Crowds: Best Practices for Data Prep & Machine Learning derived from Millions of Data Science Workflows)

演讲者:Ingo Mierswa,数据科学家,RapidMiner 创始人兼 CEO

6. 机器学习如何最终解决了 Wanamaker 悖论(How Machine Learning has Finally Solved Wanamaker』s Dilemma)

演讲者:Oliver Downs,机器学习科学家和串行技术企业家,Amplero CEO 兼首席科学家

7. 加速实现自动汽车的竞赛(Accelerating the Race to Autonomous Cars)

演讲者:Danny Shapiro,NVIDIA 汽车部门高级总监

8. 规模化学习稀疏模型(Learning Sparse Models at Scale)

演讲者:Ralf Herbrich,亚马逊 Machine Learning Science 主任

9. 现在是时候了(It』s About Time)

演讲者:Caitlin Smallwood,Netflix 科学与算法(Science and Algorithms)副总裁

10. 企业数据的肮脏小秘密(The Dirty Little Secret of Enterprise Data)

演讲者:Andy Palmer,Tamr 联合创始人兼 CEO

11. 民主化消费者身份:数据科学给 Facebook 的答案(Democratizing Consumer Identity: Data Science』s Answer to Facebook)

演讲者:Randell Cotta(Drawbridge 公司资深数据科学家),Devin Guan(Drawbridge 公司 CTO)

四、应用数据集科学特邀研讨会(Applied Data Science Invited Panel)

1. 大数据需要大梦想家:来自成功大数据投资者的经验教训(Big Data Needs Big Dreamers: Lessons from successful Big Data investors)

参与者:Evangelos Simoudis(Synapse Partners 创始人兼常务董事), Mark Gorenberg(Zetta Venture Partners 创始成员), Tim Guleri(Sierra Ventures 常务董事), Matt Ocko(DCVC Management 投资人), Greg Sands(Costanoa Venture Capital 创始人兼常务董事)

2. 大数据工具和解决方案:神话与现实(Big Data Tools and Solutions: The Myths and the Reality)

参与者:Usama Fayyad(Barclays 首席数据官、集团常务董事、首席信息官), Udo Sglavo(SAS 研发部门高级主管), Dan Steinberg(Salford Systems 总裁), Ingo Mierswa(RapidMiner 创始人兼 CEO), Richard Rovner(MathWorks 营销副总监)

本文由机器之心编译,转载请联系本公众号获得授权

------------------------------------------------

加入机器之心(全职记者/实习生):hr@almosthuman.cn

投稿或寻求报道:editor@almosthuman.cn

广告&商务合作:bd@almosthuman.cn

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
12位专家,展望未来5年深度学习发展趋势
Yoshua Bengio:深度学习的未来趋势
AI 女神李飞飞最新文章:发展人工智能应该以人为本
业界 | Claudia Perlich Quora 问答集:机器学习能力将成为数据科学家的基本要求...
计算机思维Computational Thinking
张志华:机器学习=统计与计算之恋
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服