打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
什么是博弈论,为什么它在今天如此重要
userphoto

2023.10.15 山东

关注

对我们大多数的中国人来说,生命就是生存,生存就是竞争。每当我们面临限制,例如固定数量的资源,在输赢的情况下,就会出现竞争。在我们成长的过程中,这似乎是不可避免的。老实说,即使你把范围扩大到全世界,这也是不可避免的,这是关于自然的,也是关于进化的。生态系统中的食物链平衡证明了这一点——这种与生俱来的行为适用于全人类。从竞争中来,到竞争中去,无论以何种形式,它都是普遍存在的。

博弈论(game theory)就是为了解决这种竞争问题而创立的,之前我们介绍纳什的学术成就时,引入了纳什均衡的概念,大家可以参考小约翰·福布斯·纳什这篇文章,从族谱上来说,博弈论属于应用数学的一个分支。它通常被用于创建最佳策略,以便在不确定性和知识不完全的竞争情况下取得成功(比如大多数现实生活中的场景)。

国家为领土而战,企业争夺市场份额,动物争夺资源,政党争夺选票。在一个由相互依存的主体统治的世界里,每一个人都旨在增加他们在动态系统中的“价值”,这也决定了博弈论的巨大应用价值。虽然博弈论只是从1944年开始在数学和逻辑上进行系统化,正式成为一门学科。冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》标志着现代博弈理论的初步形成,他们两人也被称为“博弈论之父”,但是博弈论思想真的是long long ago 了。

例如,在柏拉图的两篇文献,《Laches》和《Symposium》中,苏格拉底回忆起了Delium战役的一个片段,考虑一个在前线的士兵,和他的同伴一起等待抵御敌人的攻击。他可能会想,如果防守可能成功,那么他自己的个人贡献很可能并不是必要的。但如果他留下来,他有被杀或受伤的风险——所以不如逃跑。另一方面,如果敌人将赢得这场战斗,那么他死亡或受伤的机会还会更高,所以现在留在这里更是没有意义,因为防线将被敌人击垮。基于这种推理,无论战斗的结果如何,这个士兵似乎都更愿意逃跑。但如果所有士兵都这样思考——正如他们都应该那样,因为他们都处于相同的情境——那么这肯定会导致战斗失败的结果。

士兵们越是害怕战斗将会输掉,他们就越有动机让自己远离伤害。而士兵们越是相信,不需要任何特定个体的贡献,战斗就会赢,他们就越没有理由留下来战斗。如果每个士兵都预期到其他士兵也会这样推理,所有人都会迅速地使自己进入恐慌,而他们的指挥官,在敌人还没有发动攻击之前,就会输掉这场战斗。

这要放在我们中国应该怎么做,自然是韩信背水一战,堵住所有逃跑的路线,谁敢跑,立即就杀谁。我们当然可以用一个简单的收益矩阵,来对韩信背水一战来进行数学建模,比方说:

我们可以将战争策略看作一个博弈,其中的玩家(军队)在给定的策略空间中选择策略,以期最大化自己的收益。

  1. 定义博弈的参与者

    • 玩家A(韩信军)

    • 玩家B(敌军)

  2. 策略空间:对于每一个玩家,他们都有两种策略:战斗 (F) 或撤退 (R)。

  3. 收益矩阵:假设以下收益(只是一个简化的例子,实际的战争环境更为复杂):

解释:数字代表每一方的收益。例如,如果A选择战斗而B选择撤退,那么A获得2的收益,B获得0的收益。在没有背水一战的策略前,韩信军可能会考虑撤退,以避免较大的损失。但当韩信决定背水一战,策略空间发生了变化,韩信军只有战斗的选择。此时的收益矩阵:

韩信的军队现在只有战斗的选项,而敌军需要重新评估策略。如果他们预期韩信的军队因为无法撤退而战斗得更为凶猛,他们可能选择撤退以避免较大的损失。从数学的角度,韩信通过改变策略空间,影响了博弈的均衡,从而为自己创造了有利的条件。在这种情况下,韩信成功地将自己的弱势转化为强势,使敌军陷入困境。当然这里只是在纸上谈兵,我们忽略了太多真实的战争因素,甚至很可能会影响我们分析的那种。大家全当看一乐就好。

博弈论的早期大部分工作大都是像上面那样关于两人常数博弈的,因为它们最容易在数学上处理。这种游戏中的玩家有着截然相反的利益,并且对于什么构成解决方案(如最小最大定理给出的那样)存在共识。然而,在实践中出现的大多数博弈都是可变和博弈;玩家既有共同的利益,也有相反的利益。例如,买方和卖方正在进行可变和博弈(买方想要低价,卖方想要高价,但双方都想达成协议),两个敌对国家也是如此(他们可能在许多问题上存在分歧,但如果他们避免开战,双方都会受益)。这方面的工作主要由我们的纳什完成,本着精简的原则,我们只是简单来介绍一下。比方说:给定一个游戏,每个玩家都有一组可能的结果和相关效用,Nash 证明了有一个满足四个条件的唯一结果(纳什均衡)这四个条件分别是:

  1. 结果与效用函数的选择无关

  2. 两个玩家不能同时做得更好(这种情况称为帕累托最优性)。

  3. 结果与不相关的备选方案无关

  4. 结果是对称的(也就是说,如果玩家颠倒了他们的角色,解决方案将保持不变,只是收益将被逆转)。


在某些情况下,纳什解决方案似乎是不公平的,因为它是基于威胁的平衡——无法达成协议的可能性,因此双方都将遭受损失——而不是“公平”的结果。例如,当富人和穷人要得到10,000美元,只要他们能就如何分配钱达成一致(如果他们不同意,他们什么也得不到),大多数人认为公平的解决方案是每个人都得到一半,甚至穷人应该得到一半以上。

然而,根据纳什解决方案,每个玩家都有一个与所有可能结果相关的实用程序。此外,效用函数的具体选择不应影响解决方案(条件1),只要它们反映了每个人的偏好。在此示例中,假设富人的效用等于收到的钱的一半,穷人的效用等于收到的钱。这些不同的功能反映了这样一个事实,即额外收入对穷人来说更为宝贵。在纳什解决方案下,不达成协议的威胁诱使穷人接受10,000美元的三分之一,给富人三分之二。一般来说,纳什解决方案找到的结果是每个玩家获得相同数量的效用。

好像写得有点多了,就到这里吧,希望你们能喜欢。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
万字长文!《博弈论在国防中的应用综述》悉尼大学与澳大利亚国防科技2022最新40页pdf综述论文
博弈论中的纳什均衡——完全信息静态博弈
角力中的平衡点:纳什均衡
纳什均衡说了些什么
博弈论的发展历程
新制度理论简说:政治学法学理论的新发展
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服