什么是博弈论，为什么它在今天如此重要

对我们大多数的中国人来说，生命就是生存，生存就是竞争。每当我们面临限制，例如固定数量的资源，在输赢的情况下，就会出现竞争。在我们成长的过程中，这似乎是不可避免的。老实说，即使你把范围扩大到全世界，这也是不可避免的，这是关于自然的，也是关于进化的。生态系统中的食物链平衡证明了这一点——这种与生俱来的行为适用于全人类。从竞争中来，到竞争中去，无论以何种形式，它都是普遍存在的。

博弈论（game theory)就是为了解决这种竞争问题而创立的，之前我们介绍纳什的学术成就时，引入了纳什均衡的概念，大家可以参考小约翰·福布斯·纳什这篇文章，从族谱上来说，博弈论属于应用数学的一个分支。它通常被用于创建最佳策略，以便在不确定性和知识不完全的竞争情况下取得成功（比如大多数现实生活中的场景）。

国家为领土而战，企业争夺市场份额，动物争夺资源，政党争夺选票。在一个由相互依存的主体统治的世界里，每一个人都旨在增加他们在动态系统中的“价值”，这也决定了博弈论的巨大应用价值。虽然博弈论只是从1944年才开始在数学和逻辑上进行系统化，正式成为一门学科。冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》标志着现代博弈理论的初步形成，他们两人也被称为“博弈论之父”，但是博弈论思想真的是long long ago 了。

例如，在柏拉图的两篇文献，《Laches》和《Symposium》中，苏格拉底回忆起了Delium战役的一个片段，考虑一个在前线的士兵，和他的同伴一起等待抵御敌人的攻击。他可能会想，如果防守可能成功，那么他自己的个人贡献很可能并不是必要的。但如果他留下来，他有被杀或受伤的风险——所以不如逃跑。另一方面，如果敌人将赢得这场战斗，那么他死亡或受伤的机会还会更高，所以现在留在这里更是没有意义，因为防线将被敌人击垮。基于这种推理，无论战斗的结果如何，这个士兵似乎都更愿意逃跑。但如果所有士兵都这样思考——正如他们都应该那样，因为他们都处于相同的情境——那么这肯定会导致战斗失败的结果。

士兵们越是害怕战斗将会输掉，他们就越有动机让自己远离伤害。而士兵们越是相信，不需要任何特定个体的贡献，战斗就会赢，他们就越没有理由留下来战斗。如果每个士兵都预期到其他士兵也会这样推理，所有人都会迅速地使自己进入恐慌，而他们的指挥官，在敌人还没有发动攻击之前，就会输掉这场战斗。

这要放在我们中国应该怎么做，自然是韩信背水一战，堵住所有逃跑的路线，谁敢跑，立即就杀谁。我们当然可以用一个简单的收益矩阵，来对韩信背水一战来进行数学建模，比方说：

我们可以将战争策略看作一个博弈，其中的玩家（军队）在给定的策略空间中选择策略，以期最大化自己的收益。

定义博弈的参与者：

玩家A（韩信军）
玩家B（敌军）

策略空间：对于每一个玩家，他们都有两种策略：战斗 (F) 或撤退 (R)。
收益矩阵：假设以下收益（只是一个简化的例子，实际的战争环境更为复杂）：

解释：数字代表每一方的收益。例如，如果A选择战斗而B选择撤退，那么A获得2的收益，B获得0的收益。在没有背水一战的策略前，韩信军可能会考虑撤退，以避免较大的损失。但当韩信决定背水一战，策略空间发生了变化，韩信军只有战斗的选择。此时的收益矩阵：

韩信的军队现在只有战斗的选项，而敌军需要重新评估策略。如果他们预期韩信的军队因为无法撤退而战斗得更为凶猛，他们可能选择撤退以避免较大的损失。从数学的角度，韩信通过改变策略空间，影响了博弈的均衡，从而为自己创造了有利的条件。在这种情况下，韩信成功地将自己的弱势转化为强势，使敌军陷入困境。当然这里只是在纸上谈兵，我们忽略了太多真实的战争因素，甚至很可能会影响我们分析的那种。大家全当看一乐就好。

博弈论的早期大部分工作大都是像上面那样关于两人常数博弈的，因为它们最容易在数学上处理。这种游戏中的玩家有着截然相反的利益，并且对于什么构成解决方案（如最小最大定理给出的那样）存在共识。然而，在实践中出现的大多数博弈都是可变和博弈;玩家既有共同的利益，也有相反的利益。例如，买方和卖方正在进行可变和博弈（买方想要低价，卖方想要高价，但双方都想达成协议），两个敌对国家也是如此（他们可能在许多问题上存在分歧，但如果他们避免开战，双方都会受益）。这方面的工作主要由我们的纳什完成，本着精简的原则，我们只是简单来介绍一下。比方说：给定一个游戏，每个玩家都有一组可能的结果和相关效用，Nash 证明了有一个满足四个条件的唯一结果(纳什均衡）：这四个条件分别是：

结果与效用函数的选择无关
两个玩家不能同时做得更好（这种情况称为帕累托最优性）。
结果与不相关的备选方案无关
结果是对称的（也就是说，如果玩家颠倒了他们的角色，解决方案将保持不变，只是收益将被逆转）。

在某些情况下，纳什解决方案似乎是不公平的，因为它是基于威胁的平衡——无法达成协议的可能性，因此双方都将遭受损失——而不是“公平”的结果。例如，当富人和穷人要得到10,000美元，只要他们能就如何分配钱达成一致（如果他们不同意，他们什么也得不到），大多数人认为公平的解决方案是每个人都得到一半，甚至穷人应该得到一半以上。

然而，根据纳什解决方案，每个玩家都有一个与所有可能结果相关的实用程序。此外，效用函数的具体选择不应影响解决方案（条件1），只要它们反映了每个人的偏好。在此示例中，假设富人的效用等于收到的钱的一半，穷人的效用等于收到的钱。这些不同的功能反映了这样一个事实，即额外收入对穷人来说更为宝贵。在纳什解决方案下，不达成协议的威胁诱使穷人接受10,000美元的三分之一，给富人三分之二。一般来说，纳什解决方案找到的结果是每个玩家获得相同数量的效用。

好像写得有点多了，就到这里吧，希望你们能喜欢。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。