小乐数学科普：1000万美元AI-MO奖（人工智能奥数奖）难度不亚于解决黎曼猜想？

日前，伦敦金融科技公司XTX Markets推出一项新的1000万美元挑战基金，即AI奥数奖：人工智能数学奥林匹克奖（AI-MO 奖，是AI与IMO，这两个缩写词的合成，省略了中间的一个字母I）。该基金旨在促进能够进行数学推理的人工智能模型的发展，从而创建一个公开共享的人工智能模型，能在国际数学奥林匹克竞赛（IMO）中获得金牌。

500万美元的大奖将颁发给第一个公开分享的人工智能模型，该模型将进入AI-MO批准的比赛，并以相当于IMO金牌的标准表现。还有一系列进步奖，总额高达500万美元，用于公开分享的人工智能模型，这些模型实现大奖的关键里程碑。

众所周知，国际奥数（IMO）是一项享有盛誉的全球高中数学竞赛。各国将组成由六名学生组成的团队，每名学生在两天内在考试情况下单独尝试六个极具挑战性的问题。解答由专家小组进行评分，并决定颁发个人金牌、银牌和铜牌。IMO金牌是卓越数学成就的基准，也是未来成功的有力预测指标。

在获得菲尔兹奖方面，IMO金牌获得者的可能性是一个典型的剑桥博士毕业生的50倍。事实上，菲尔兹奖获得者中有一半在年轻时就参加了IMO。基于这些传统，AI-MO奖的设立旨在加速人工智能模型的发展，这些模型可以通过数学推理来解决问题。这是知识和科学发现的新前沿，AI-MO奖可能代表一个新的图灵测试。

AI-MO奖提出了三个初步设计原则：

1、人工智能模型必须以与人类参赛者相同的格式处理问题，并且必须生成人类可读的解题答案，这些解答可以由专家小组使用标准的奥林匹克竞赛标准进行评分。

2、该大奖将颁发给在AI-MO批准的比赛中的表现，应相当于IMO的金牌标准。

3、要获得获奖资格，参赛者必须在颁奖时遵守 AI-MO 公开分享协议。

AI-MO奖是独立运作的。它不是IMO比赛的正式组成部分，也不属于IMO大挑战赛（IMO Grand Challenge https://imo-grand-challenge.github.io）。然而，它的目标是通过颁发AI-MO奖项与IMO成员和一系列奥林匹克竞赛选手合作。AI-MO奖有助于在技术层面上，以一种易于理解和吸引更广泛的公众的方式，比较不同的人工智能问题解决策略。该奖项将由 AI-MO顾问委员会设计，委员包括数学家、深度学习专家和经验丰富的奥林匹克出题者。

首批AI-MO批准的比赛将于2024年初向参赛者开放。将于 2024年7月在英国巴斯举行的第65届国际奥数竞赛IMO上介绍进展情况。有关奖项、比赛和资格标准的更多详细信息将在未来几周内公布。

关于AI-MO奖，大佬如是说：

“

使用困难的数学问题作为基准来确定人工智能是否能够匹配人类的最高认知功能是一个绝妙的主意。

每年，来自110多个国家的600多名最优秀的学生都会面临六个极其困难的IMO问题的挑战，通常只有一两个学生在分配的9小时内解决全部6个IMO问题。这些问题考验着他们制定概念和进行长链推理的能力。

我相信很多人都会非常兴奋地关注AI-MO奖，看看未来人工智能何时能与世界上最聪明的年轻人相媲美。

”

Gregor Dolinar（格雷戈尔·多利纳尔） —— 国际数学奥林匹克竞赛IMO主席

“

现代人工智能系统在进行书面交流时模仿人类的能力非常出色。但是，仅当人们已经将大量相关材料放在互联网上时，这种效果才最好。

模仿一个有创造力的数学家进行抽象推理将是一项艰巨的任务。全球IMO社区将很高兴参与支持这项竞赛，因为我们寻求与最优秀的年轻数学家一起衡量人工智能系统。

”

Geoff Smith（杰夫·史密斯）——国际数学奥林匹克竞赛IMO前主席，AI-MO奖顾问委员会成员

“

尽管最近取得了进展，但使用人工智能来解决或至少帮助解决高级数学问题仍然是一个极其复杂和多方面的挑战。为实现这一目标，尝试多种方法，并对每种方法的性能进行基准测试，这一点非常重要。

AI-MO奖承诺提供至少一套这样的基准，这将有助于在技术层面上，以一种易于理解和吸引广大公众的方式，比较不同的人工智能问题解决策略。

”

Terence Tao（陶哲轩）——加州大学洛杉矶分校，菲尔兹奖（2006）得主

“

LLM大语言模型的进步令人瞩目，在许多领域展示了多功能性。然而，数学推理提出了一个独特而重大的挑战，这些模型仍在努力克服这一挑战。

IMO是世界上最著名的智力竞赛之一，因其复杂性和严谨性而备受推崇。它是人工智能的终极挑战，突破了人工智能在高级数学问题解决方面所能实现的界限。

人工智能模型在IMO中赢得金牌的前景不仅仅是一个里程碑；这是迈向强大的人工智能驱动的数学推理的巨大飞跃。这一成就将标志着通用人工智能迈向人工智能的深远时刻，超越了现有的局限性，开辟了数学的新视野。

”

Leonardo de Moura（莱昂纳多·德·莫拉）—— 亚马逊云AWS自动推理小组（https://www.amazon.science/research-areas/automated-reasoning ）高级首席应用科学家，Lean FRO（https://lean-fro.org ）联合创始人兼首席架构师

“

AI-MO奖正在推动大语言模型目前薄弱的领域，即逻辑和推理。解决这个问题将是制造智能机器的重要一步。

该奖项与IMO竞赛的一大区别在于，AI-MO参赛者只能以人类可读的形式给出问题，并且还必须以人类可读的形式给出输出。当2019年设立IMO大挑战赛（IMO Grand Challenge）时，这似乎遥不可及，因此我们要求一台机器具有与问题相对应的计算机代码，并且必须编写出与答案相对应的代码。

大语言模型的最新进展使得取消这一限制变得很自然，而这正是 AI-MO 奖正在做的事情。

”

Kevin Buzzard（凯文·巴扎德）——伦敦帝国理工学院

关于这个奖项，你怎么看？欢迎留言评论。

参考资料

AI-MO奖官网 https://aimoprize.com/

2024年第65届IMO委员会 https://www.imo-official.org/advisory.aspx

唯思客俱乐部 https://mp.weixin.qq.com/s/DNTtPITVwjWUNL_hB2a2RQ

量子位 https://mp.weixin.qq.com/s/gX6A9l-r287q1fxlMKHUkg

小乐数学软件GitHub开源地址 https://github.com/zzllrr/Mather

IMO大挑战赛 https://imo-grand-challenge.github.io/

陶哲轩图源 https://www.whitehouse.gov/pcast/members/terence-tao/

Kevin Buzzard图源 https://blogs.imperial.ac.uk/imperial-people/2018/10/15/professor-kevin-buzzard-professor-of-pure-mathematics-mathematics/

Leonardo de Moura图源 https://leodemoura.github.io

亚马逊云AWS自动推理小组 https://www.amazon.science/research-areas/automated-reasoning

Lean FRO https://lean-fro.org

小乐数学科普：2022国际数学家大会一小时报告《数学形式主义的兴起》Kevin Buzzard 演讲全文

小乐数学科普：专访ICM 2022国际数学家大会一小时报告者Kevin Buzzard：计算机可以成为数学家吗？——译自量子杂志

小乐数学科普：2022-12-22在这个很2的日子，向ChatGPT引擎问了22+个数学问题，这是一种什么体验？

小乐数学科普：国产AI进行时——用人工智能解数学题——好未来MathGPT测评

让数学

更加

易学易练，

易教易研，

易赏易玩，

易见易得，

易传易及。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。