好玩的博弈论 - 什么是博弈论 | 记录seraphln的成长历程。

博弈论

博弈论是指双方或者多方存在竞争、合作、冲突等情况下，通过充分了解各方信息，并依此选择一种能为本方争取最大利益的最优决策的理论。日常生活中有很多的事情和故事都有博弈论的应用，比如“田忌赛马”。

田忌赛马

齐国大将田忌平日里喜欢跟贵族赛马赌钱。赛马的规则是每一方出上等马、中等马、下等马各一匹，共赛三场，三局两胜制。由于田忌的马比贵族的马略逊一筹，所以十赌九输。当时孙膑在田忌的府中做客，经常看见田忌同贵族赛马，对赛马的规则和双方马的实力差距都比较了解。某天孙膑看见田忌赛马又输了之后对田忌说：“明天你尽管同那些贵族们下大注，我保证让你把输的钱赢回来。”田忌相信了孙膑，第二天约贵族赛马，并下了千金赌注。

孙膑为什么敢打保证呢？因为他对这场赛马的博弈做了分析，双方都派上等马、中等马和下等马各一匹，田忌每一个等级的马都比对方要弱一点。但是因为没有规定出场顺序，所以比赛的对阵形势可能有6种，每一种对阵形势的结局都是比较容易能猜到的：

第一种情况： 田忌的上等马对贵族的上等马，田忌的中等马对贵族的中等马，田忌的下等马对贵族的下等马。结局是：田忌0胜3败。
第二种情况： 田忌的上等马对贵族的上等马，田忌的中等马对贵族的下等马，田忌的下等马对贵族的中等马。结局是：田忌1胜2败。
第三种情况： 田忌的中等马对贵族的上等马，田忌的上等马对贵族的中等马，田忌的下等马对贵族的下等马。结局是：田忌1胜2败。
第四种情况： 田忌的中等马对贵族的上等马，田忌的上等马对贵族的下等马，田忌的下等马对贵族的中等马。结局是：田忌1胜2败。
第五种情况： 田忌的下等马对贵族的上等马，田忌的上等马对贵族的中等马，田忌的中等马对贵族的下等马。结局是：田忌2胜1败。
第六种情况： 田忌的下等马对贵族的上等马，田忌的中等马对贵族的中等马，田忌的上等马对贵族的下等马。结局是：田忌1胜2败。

这六种对阵情况，只有第五种情况才能让田忌取胜，因此孙膑也是建议田忌按照第五种情况来进行比赛。结果也确实如孙膑所料，田忌赢得了比赛。

在田忌赛马这个故事中，田忌同齐国的贵族便是博弈的双方，也称为博弈的参与者。孙膑充分了解了各方的信息，也就是比赛的规则与每匹马之间的实力差距，并在所有的策略集合中选择了一个能争取最大利益的策略，也就是最优策略。所以说“田忌赛马”是一个很典型的博弈论在实际应用中的例子。

博弈与博弈论

“博弈”的字面意思是指赌博和下围棋，现在也泛指为了利益进行竞争的这种行为。自从人类存在的那一天开始，博弈便存在。

博弈论则是一种系统的理论，属于应用数学的一个分支。可以说博弈中体现着博弈论的思想，是博弈论在现实中的体现。

博弈作为一种争取利益的竞争，始终伴随着人类的发展。但是博弈论作为一门科学理论，是1928年由冯诺依曼（真大神）建立的。

博弈的四要素

一场博弈一般包含了4个基本要素。

至少2个参与者（或者周伯通的左右互搏）博弈论中的参与者又被称为决策主体，也就是在博弈中制定决策的人。没有参与者也就不会有博弈，而且参与者至少为2个人。参与者在博弈中的表现便是制定决策与对方的决策抗衡，并为自己争取最大的利益。参与者之间的关系是相互影响的，自己在制定策略的时候往往需要参考对方的策略。
利益。从博弈论的定义可以得出，双方或者多方进行博弈的最终目的都是为了给自己争取最大的利益。因此利益是博弈中必不可少的一个要素。利益是一个抽象的概念，不单单指钱，可以是指在一定时间内锁定哪个电视频道，可以是指战争的胜利、获得荣誉、赢得比赛等。但是有一点，必须是决策主体在意的东西才能称为利益。例如，在《红楼梦》中曾经写到一群人陪贾母打牌，其中有王熙凤，结果是凤姐输了钱，贾母赢了钱。但是，王熙凤陪着贾母打牌不是为了赢钱，而是为了哄老太太高兴。贾母赢了钱很高兴，王熙凤哄了老太太开心也很满足。所以在这场博弈中，双方都得到了利益上的满足。
策略。在博弈中，决策主体根据获得的信息和自己的判断，制定出一个行动方案。这个行动方案就是策略。通俗的说，策略就是指决策主体做出的，用来解决问题的手段、计谋、计策。博弈论的关键在于制定一个能帮助本方获取最大利益的策略，也就是最优策略。同时，策略必须要有选择性。如果只有一种选择那就不是策略了。
信息。利益是博弈的目的，策略是获得利益的手段，而信息就是制定策略的依据。要想制定出战胜对方的策略，就需要获得尽可能全面的信息。《孙子兵法》中就说“知己知彼，百战不殆”。同时，信息都有真假，因此甄别信息真假非常重要。此外，还应该学会从看似平常的事务中识别信息。典型的例子就是“卖水”的故事了。

前提是理性

在博弈论中有一个假定前提，也就是谈论博弈论最基本的前提，那就是博弈的所有参与者都是“理性人”

“理性人”源自经济学术语“理性经济人”，这是西方经济学中一个基本的架设，是指参与者都是利己的，在几种策略中他们会选择能给自己带来最大利益的那一个。因为每个参与者都是理性的，所以参与者在理性的制定策略的时候，会考虑到对方的策略，因为对方也是理性的。但是回到田忌赛马的例子，如果田忌根本不理会孙膑的建议，依然按照第一种情况进行比赛，那田忌就不是一个理性人了。

博弈的分类

合作博弈和非合作博弈

根据博弈的参与者之间是否有一个具有约束力的协议，博弈分为合作博弈和非合作博弈。

合作博弈不是指参与者之间有合作的意向，或者合作态度，而是参与者之间有具有约束力的协议、约定或者契约。参与者必须在这些协议的范围内进行博弈。非合作博弈是指参与者在博弈的时候，无法达成一个对各方都有约束力的协议。

合作博弈是研究合作中如何分配利益的问题，目的是使得协议框架内所有参与者都满意。而非合作博弈的目的是如何为自己争取最大化的利益，并不考虑其他参与者的利益。

合作博弈典型的例子是欧佩克（OPEC）成员国之间的博弈。他们的成员国是这个合作博弈中的参与者。所有的参与者都a想通过OPEC为自己争取最大利益。所有参与者遵循统一的石油政策，产油数量和石油价格都由OPEC调度。如果没有OPEC这样的组织，各个产油国自己决定产油数量和出口价格，这样很容易陷入到各种恶性竞争（价格竞争、随意增加产油量导致价格下降等）。

非合作博弈强调的是对自己利益最大化的争取，不考虑其他参与者的利益，与其他参与者之间没有共同遵守的协议。非合作博弈远比合作博弈要复杂。比如《三国演义》中的“空城计”就是一个典型的非合作博弈。

静态博弈和动态博弈

按照参与者选择策略、作出决定的先后顺序，博弈可以分为静态博弈和动态博弈。

如果参与者们同时选择策略，或者虽然有先后，但是后作出策略的参与者并不知道其他参与者的策略，那这种博弈就叫做静态博弈。“剪刀石头布”就是一个静态博弈。再比如，项目招标中的竞标者，每一个竞标者都不知道其他公司的策略（除非商业间谍），尽管投标时间有先后，但是取得的效果与大家同时竞标是一样的，因此这是一场静态博弈。

如果参与者的行动有先后顺序，并且后者是在了解前者策略的前提下制定自己的策略，这种情况就是动态博弈，比如下象棋、打扑克。

负和博弈、零和博弈和正和博弈

负和博弈是指博弈的参与者最后得到的收获都小于付出，都没有占到便宜，是一种两败俱伤的博弈。

零和博弈是指参与者中一方获益，另一方损失，并且参与者之间获得的利益与损失之和为0。赌博便是一种零和博弈，赌桌上一定会有赢家和输家。赢家赢的钱就是输家输的钱。

正和博弈又被称为双赢博弈、合作博弈，是指参与者都能获益，或者一方的收益增加不会影响其他参与者的利益，这种博弈被认为是结局最好的一种博弈，也就是win-win。现实生活中有很多正和博弈的例子，比如鳄鱼和鳄鱼鸟。

追求最佳、避免最差

博弈中取胜的关键是有一个好的策略，而策略的制定又要考虑到对方的策略。策略的选择一般有2个行动准则：

寻找并应用优势策略；
寻找并避免劣势策略。

优势策略

在博弈论中，有一个很重要的概念叫做：优势策略（Dominant strategy），是指在一场博弈中，对于某一个参与者Alice来说，无论其他的参与者采用何种策略，有一个策略对于Alice来说始终都是最佳策略，那么这个策略就是优势策略。在任何博弈中，我们都应该倾向于选择优势策略，避免劣势策略。

智猪博弈

智猪博弈的背景是：一头大猪和一头小猪生活在一起，大猪去碰按钮后投下食物两头猪会一起吃，而若是小猪去碰按钮，还没跑到食槽，投下的食物就已经被大猪吃完了。

寻找并应用优势策略

对于小猪来说，可以选择的策略有： 1. 去碰按钮，但是食物被大猪吃完；2. 不碰按钮，等大猪碰了之后和大猪一起吃。所以对于小猪来说，不管大猪如何选择，小猪的优势策略是策略2。

对于大猪来说，可以选择的策略有： 1. 去碰按钮，和小猪一起吃； 2. 不碰按钮，等小猪碰了之后吃完所有的食物。所以大猪的优势策略是策略2。

寻找并避免劣势策略

但是如果大猪选择策略2，小猪选择策略1.最终的结果是2头猪都饿死。这对于2只猪来说都是最差的策略。所以大猪只能选择策略1。和小猪一起吃。