GANs：过去20年深度学习领域最酷的构想

在加州理工学院（Caltech）教授、畅销书作者理查德·费曼（Richard Feynman）去世的那一天，他教室的黑板上写着一句话：“我不能创造的东西，我就不了解。”

伊恩·古德费洛（Ian Goodfellow）引用了这位伟大物理学家的上述名言来解释自己在谷歌人工智能实验室Google Brain所做的研究：人工智能不能创造的东西，它就不了解。

古德费洛是世界上最重要的人工智能研究者之一，他在谷歌成立了一个探索“生成模型”（generative models）的新研究团队。

生成模型是可以创造照片、声音以及其他现实世界表征的系统。在致敬费曼的同时，古德费洛将这一努力描述为通往各种人工智能的重要路径。

“如果一个人工智能可以基于逼真的细节来想象这个世界，即学习如何想象出逼真的图像和逼真的声音，这将鼓励人工智能学习实际存在的世界的结构，”他解释说，“这可以帮助人工智能理解它看到的图像或听到的声音。”

2014年，古德费洛是蒙特利尔大学（University of Montreal）的一名博士生，一次在酒吧喝到微醺跟友人争论后，他构想出一种名为“生成对抗网络”（generative adversarial networks，简称GANs）的人工智能技术。

尽管GANs在啤酒的浸润之下诞生，但它不失为一种非常优雅的设计：比如一个人工智能负责生成逼真的图像；另一个人工智能负责分析图像的真假。

“你可以把这想象成一个艺术家和一个艺术评论家，”古德费洛说，“生成模型想要愚弄艺术评论家，使其相信它生成的图像是真的。”

由于第二个人工智能会竭力找到图像为假的证据，第一个人工智能无法独自完成模拟真实的学习。

在此过程中，这两个神经网络将推动人工智能不断向前发展，直至有一天计算机能够宣布脱离自己的人类老师。

扬·勒丘恩（Yann LeCun）是Facebook人工智能研究部门的主管，他曾把GANs称为“过去20年深度学习领域最酷的想法。”

作为人工智能的分支，深度学习正在改变所有互联网巨头公司的前进方向，包括谷歌、微软、亚马逊以及Facebook。

尽管古德费洛的想法仍处发展阶段，但这已在人工智能学界迅速传播。包括勒丘恩在内的很多研究者认为，它们可以实现“无监督学习”，也就是让机器在没有人类直接帮助的情况下学习。

做对这件事

古德费洛正是在蒙特利尔的酒吧想到GANs的。那晚，有朋友提及一个新的研究项目，即使用数学方法确定图像内容，再把所有数据输入计算机，使其自主生成图像。

带有几分醉意的古德费洛表示，这个想法永远不可能奏效，因为需要考虑的统计数据实在太多，没人能把它们全都记录下来。

但就在那时，他突然想到一个更好的方法：让神经网络来教导机器生成逼真的图像。

神经网络是一个复杂的数学系统，它通过分析大量数据来学习处理工作任务，比如说识别照片中的面孔以及理解口头语言。

古德费洛在那间酒吧里想到，当一个神经网络学习生成逼真图像时，另一个神经网络可以扮演它的对手，试着判定图像的真假。

古德费洛表示，通过这种方法，它最终可以教会第一个神经网络生成以假乱真的图像。

争论随之而来。古德费洛的朋友同样坚称，这种方法不会奏效。于是，在晚上回家之后，古德费洛构建了GANs。

“我到家后还有点醉醺醺的，我的女朋友已经睡着了。我坐在那里想：‘酒吧里的那些朋友是错的！’”他回忆道，“我熬夜在笔记本电脑上写出了GANs的代码。”

古德费洛声称，自己的代码在首次测试时就正常运行了。“那真的非常非常幸运。”他说，“因为如果没有运行起来，我可能就放弃了这个想法。”

当年晚些时候，古德费洛和其他一些研究者共同发表了一篇论文，阐述这个想法。在那之后的三年，又有数百篇论文对GANs的概念进行了探讨。

在那第一篇论文中，古德费洛描述了两个神经网络，它们构成一个系统，可以生成出手写数字的逼真图像。

现在，研究者正把该想法应用于所有图像，从猫到火山再到整个星系，无所不包。GANs甚至对天文学实验提供了帮助，被用于粒子物理学的模拟。

不过，GANs仍然是非常难以实现的事情，它需要同时训练两个神经网络，而不仅仅是一个。

在谷歌，古德费洛成立了一个聚焦于GANs和相关研究的新团队，他希望改进这个过程。

古德费洛说，我们将能拥有好得多的服务。它们不仅能更好地生成图像和声音，而且能更好地识别图像和声音，从而走向一种不需要太多人类帮助就能学到更多知识的系统。

GANs甚至可以实现如今还不存在的无监督学习。

目前，神经网络可以通过分析数百万张猫的照片来学习识别猫，但研究者不得不仔细甄别这些照片，并进行标记。

人类仍然需要深度参与其中，而这往往是一个问题，比如人类存在偏见，或者是训练人工智能需要庞大的人力劳动。

像勒丘恩这样的研究者，他们正在推动不需要如此多人类参与就能进行学习的系统，这将加速人工智能的进化。

不过，这只是开始。GANs同样带来了很多其他可能性。

南加州大学（University of Southern California）的人工智能研究员大卫·卡莱（David Kale）认为，这个想法可以帮助他和同事在不侵犯患者隐私的情况下构建医疗保健人工智能。

基本上，GANs可以生产假的医疗记录。然后，机器学习系统可以利用这些假数据进行训练，不再需要患者的真实病历。

“与其把患者医疗记录放在网上让所有人随意使用，我们为什么不先使用这些数据训练GANs，让它生成一个完全合成的数据集，再提供给研究者使用呢？”卡莱说，“我们为什么不这样做，好让任何通过这个数据集训练的模型都能匹敌通过原始数据训练的模型？”

虽然很多研究者都在探索GANs背后的想法，但古德费洛在谷歌内部组建专门团队这件事尤其引人注目。

他曾是从谷歌跳槽到OpenAI的研究者之一，后者承诺向全世界分享自己的研究成果。但不到一年后，古德费洛又重返谷歌，因为他的合作者都在该公司。

分享很重要，但紧密合作也是一样——不管你是人工智能研究者还是神经网络。

翻译：何无鱼

来源：WIRED

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。