图片来源:Pexels 的 Pavel Danilyuk
DeepMind的一个研究团队专注于人工智能的下一个前沿领域——通用人工智能(AGI),他们意识到他们需要首先解决一个关键问题。他们问,AGI到底是什么?
它通常被视为一种人工智能,具有在广泛的任务中理解、学习和应用知识的能力,其运作方式与人脑类似。维基百科扩大了范围,认为AGI是“一种假设的智能代理,可以学习完成人类或动物可以执行的任何智力任务。
OpenAI 的章程将 AGI 描述为一组“高度自主的系统,在最具经济价值的工作中优于人类”。
人工智能专家和几何智能的创始人加里·马库斯(Gary Marcus)将其定义为“任何灵活和通用的智能,其足智多谋和可靠性可与(或超越)人类智能相媲美。
由于定义有如此多的变化,DeepMind团队接受了伏尔泰几个世纪前提出的一个简单的概念:“如果你想和我交谈,请定义你的术语。
在预印本服务器arXiv上发表的一篇论文中,研究人员概述了他们所谓的“对AGI模型的能力和行为进行分类的框架”。
通过这样做,他们希望为研究人员在衡量进展、比较方法和评估风险时建立一种共同语言。
“对于我们领域的许多人来说,实现人类水平的'智能'是一个隐含或明确的北极星目标,”Shane Legg说,他在20年前引入了AGI一词。
在接受《麻省理工评论》采访时,莱格解释说:“我看到很多讨论,人们似乎用这个词来表示不同的东西,这导致了各种混乱。现在,AGI正成为一个如此重要的话题,我们需要明确我们的意思。
在arXiv的论文中,题为“AGI的水平:在AGI的道路上实施进展”,该团队总结了AGI模型所需的几个原则。它们包括关注系统的功能,而不是过程。
“实现AGI并不意味着系统'思考'或'理解'[或]拥有意识或感知等品质,”该团队强调。
AGI系统还必须具有学习新任务的能力,并知道何时向人类寻求澄清或帮助。
另一个参数是关注程序的潜在,而不一定是程序的实际部署。研究人员解释说:“要求部署作为测量AGI的条件会带来非技术障碍,例如法律和社会考虑,以及潜在的道德和安全问题。
然后,该团队编制了一份智力阈值列表,范围从“0级,无AGI”到“5级,超人”。1-4 级包括“新兴”、“胜任”、“专家”和“大师”成就级别。
三个程序达到了AGI标签的门槛。但是这三个生成文本模型(ChatGPT、Bard 和 Llama 2)只达到了“一级,新兴”。目前没有其他人工智能程序符合AGI的标准。
其他被列为人工智能的项目包括SHRDLU,这是麻省理工学院开发的早期自然语言理解计算机,被列为“1级新兴人工智能”。
在“2 级,胜任”是 Siri、Alexa 和 Google Assistant。语法检查器 Grammarly 的排名为“3 级,专家 AI”。
在这个名单上,在“4级,Virtuoso”中,是深蓝和AlphaGo。位居榜首的是 DeepMind 的 AlphaFold,它根据蛋白质的氨基酸序列预测蛋白质的 5D 结构;以及 StockFish,一个强大的开源国际象棋程序。
然而,AGI没有单一的拟议定义,并且不断变化。
“随着我们对这些潜在过程的深入了解,重新审视我们对AGI的定义可能很重要,”Google DeepMind人类和AI交互首席科学家Meredith Ringel Morris说。
研究人员说:“不可能列举出足够普遍的智能可以实现的全部任务。“因此,AGI基准应该是一个活生生的基准。因此,这种基准应包括一个制定和商定新任务的框架。
原文标题:Researchers seek consensus on what constitutes Artificial General Intelligence
原文链接:
https://techxplore.com/news/2023-11-consensus-constitutes-artificial-general-intelligence.html
联系客服