好玩的博弈论 - 什么是博弈论


博弈论

博弈论是指双方或者多方存在竞争、合作、冲突等情况下,通过充分了解各方信息,并依此选择一种能为本方争取最大利益的最优决策的理论。日常生活中有很多的事情和故事都有博弈论的应用,比如“田忌赛马”。

田忌赛马

齐国大将田忌平日里喜欢跟贵族赛马赌钱。赛马的规则是每一方出上等马、中等马、下等马各一匹,共赛三场,三局两胜制。由于田忌的马比贵族的马略逊一筹,所以十赌九输。当时孙膑在田忌的府中做客,经常看见田忌同贵族赛马,对赛马的规则和双方马的实力差距都比较了解。某天孙膑看见田忌赛马又输了之后对田忌说:“明天你尽管同那些贵族们下大注,我保证让你把输的钱赢回来。”田忌相信了孙膑,第二天约贵族赛马,并下了千金赌注。

孙膑为什么敢打保证呢?因为他对这场赛马的博弈做了分析,双方都派上等马、中等马和下等马各一匹,田忌每一个等级的马都比对方要弱一点。但是因为没有规定出场顺序,所以比赛的对阵形势可能有6种,每一种对阵形势的结局都是比较容易能猜到的:

第一种情况: 田忌的上等马对贵族的上等马,田忌的中等马对贵族的中等马,田忌的下等马对贵族的下等马。结局是:田忌0胜3败。
第二种情况: 田忌的上等马对贵族的上等马,田忌的中等马对贵族的下等马,田忌的下等马对贵族的中等马。结局是:田忌1胜2败。
第三种情况: 田忌的中等马对贵族的上等马,田忌的上等马对贵族的中等马,田忌的下等马对贵族的下等马。结局是:田忌1胜2败。
第四种情况: 田忌的中等马对贵族的上等马,田忌的上等马对贵族的下等马,田忌的下等马对贵族的中等马。结局是:田忌1胜2败。
第五种情况: 田忌的下等马对贵族的上等马,田忌的上等马对贵族的中等马,田忌的中等马对贵族的下等马。结局是:田忌2胜1败。
第六种情况: 田忌的下等马对贵族的上等马,田忌的中等马对贵族的中等马,田忌的上等马对贵族的下等马。结局是:田忌1胜2败。

这六种对阵情况,只有第五种情况才能让田忌取胜,因此孙膑也是建议田忌按照第五种情况来进行比赛。结果也确实如孙膑所料,田忌赢得了比赛。

在田忌赛马这个故事中,田忌同齐国的贵族便是博弈的双方,也称为博弈的参与者。孙膑充分了解了各方的信息,也就是比赛的规则与每匹马之间的实力差距,并在所有的策略集合中选择了一个能争取最大利益的策略,也就是最优策略。所以说“田忌赛马”是一个很典型的博弈论在实际应用中的例子。

博弈与博弈论

“博弈”的字面意思是指赌博和下围棋,现在也泛指为了利益进行竞争的这种行为。自从人类存在的那一天开始,博弈便存在。

博弈论则是一种系统的理论,属于应用数学的一个分支。可以说博弈中体现着博弈论的思想,是博弈论在现实中的体现。

博弈作为一种争取利益的竞争,始终伴随着人类的发展。但是博弈论作为一门科学理论,是1928年由冯诺依曼(真大神)建立的。

博弈的四要素

一场博弈一般包含了4个基本要素。

  1. 至少2个参与者(或者周伯通的左右互搏)博弈论中的参与者又被称为决策主体,也就是在博弈中制定决策的人。没有参与者也就不会有博弈,而且参与者至少为2个人。参与者在博弈中的表现便是制定决策与对方的决策抗衡,并为自己争取最大的利益。参与者之间的关系是相互影响的,自己在制定策略的时候往往需要参考对方的策略。
  2. 利益。从博弈论的定义可以得出,双方或者多方进行博弈的最终目的都是为了给自己争取最大的利益。因此利益是博弈中必不可少的一个要素。利益是一个抽象的概念,不单单指钱,可以是指在一定时间内锁定哪个电视频道,可以是指战争的胜利、获得荣誉、赢得比赛等。但是有一点,必须是决策主体在意的东西才能称为利益。例如,在《红楼梦》中曾经写到一群人陪贾母打牌,其中有王熙凤,结果是凤姐输了钱,贾母赢了钱。但是,王熙凤陪着贾母打牌不是为了赢钱,而是为了哄老太太高兴。贾母赢了钱很高兴,王熙凤哄了老太太开心也很满足。所以在这场博弈中,双方都得到了利益上的满足。
  3. 策略。在博弈中,决策主体根据获得的信息和自己的判断,制定出一个行动方案。这个行动方案就是策略。通俗的说,策略就是指决策主体做出的,用来解决问题的手段、计谋、计策。博弈论的关键在于制定一个能帮助本方获取最大利益的策略,也就是最优策略。同时,策略必须要有选择性。如果只有一种选择那就不是策略了。
  4. 信息。利益是博弈的目的,策略是获得利益的手段,而信息就是制定策略的依据。要想制定出战胜对方的策略,就需要获得尽可能全面的信息。《孙子兵法》中就说“知己知彼,百战不殆”。同时,信息都有真假,因此甄别信息真假非常重要。此外,还应该学会从看似平常的事务中识别信息。典型的例子就是“卖水”的故事了。

前提是理性

在博弈论中有一个假定前提,也就是谈论博弈论最基本的前提,那就是博弈的所有参与者都是“理性人”

“理性人”源自经济学术语“理性经济人”,这是西方经济学中一个基本的架设,是指参与者都是利己的,在几种策略中他们会选择能给自己带来最大利益的那一个。因为每个参与者都是理性的,所以参与者在理性的制定策略的时候,会考虑到对方的策略,因为对方也是理性的。但是回到田忌赛马的例子,如果田忌根本不理会孙膑的建议,依然按照第一种情况进行比赛,那田忌就不是一个理性人了。

博弈的分类

合作博弈和非合作博弈

根据博弈的参与者之间是否有一个具有约束力的协议,博弈分为合作博弈和非合作博弈。

合作博弈不是指参与者之间有合作的意向,或者合作态度,而是参与者之间有具有约束力的协议、约定或者契约。参与者必须在这些协议的范围内进行博弈。非合作博弈是指参与者在博弈的时候,无法达成一个对各方都有约束力的协议。

合作博弈是研究合作中如何分配利益的问题,目的是使得协议框架内所有参与者都满意。而非合作博弈的目的是如何为自己争取最大化的利益,并不考虑其他参与者的利益。

合作博弈典型的例子是欧佩克(OPEC)成员国之间的博弈。他们的成员国是这个合作博弈中的参与者。所有的参与者都a想通过OPEC为自己争取最大利益。所有参与者遵循统一的石油政策,产油数量和石油价格都由OPEC调度。如果没有OPEC这样的组织,各个产油国自己决定产油数量和出口价格,这样很容易陷入到各种恶性竞争(价格竞争、随意增加产油量导致价格下降等)。

非合作博弈强调的是对自己利益最大化的争取,不考虑其他参与者的利益,与其他参与者之间没有共同遵守的协议。非合作博弈远比合作博弈要复杂。比如《三国演义》中的“空城计”就是一个典型的非合作博弈。

静态博弈和动态博弈

按照参与者选择策略、作出决定的先后顺序,博弈可以分为静态博弈和动态博弈。

如果参与者们同时选择策略,或者虽然有先后,但是后作出策略的参与者并不知道其他参与者的策略,那这种博弈就叫做静态博弈。“剪刀石头布”就是一个静态博弈。再比如,项目招标中的竞标者,每一个竞标者都不知道其他公司的策略(除非商业间谍),尽管投标时间有先后,但是取得的效果与大家同时竞标是一样的,因此这是一场静态博弈。

如果参与者的行动有先后顺序,并且后者是在了解前者策略的前提下制定自己的策略,这种情况就是动态博弈,比如下象棋、打扑克。

负和博弈、零和博弈和正和博弈

负和博弈是指博弈的参与者最后得到的收获都小于付出,都没有占到便宜,是一种两败俱伤的博弈。

零和博弈是指参与者中一方获益,另一方损失,并且参与者之间获得的利益与损失之和为0。赌博便是一种零和博弈,赌桌上一定会有赢家和输家。赢家赢的钱就是输家输的钱。

正和博弈又被称为双赢博弈、合作博弈,是指参与者都能获益,或者一方的收益增加不会影响其他参与者的利益,这种博弈被认为是结局最好的一种博弈,也就是win-win。现实生活中有很多正和博弈的例子,比如鳄鱼和鳄鱼鸟。

追求最佳、避免最差

博弈中取胜的关键是有一个好的策略,而策略的制定又要考虑到对方的策略。策略的选择一般有2个行动准则:

  1. 寻找并应用优势策略;
  2. 寻找并避免劣势策略。

优势策略

在博弈论中,有一个很重要的概念叫做: 优势策略(Dominant strategy),是指在一场博弈中,对于某一个参与者Alice来说,无论其他的参与者采用何种策略,有一个策略对于Alice来说始终都是最佳策略,那么这个策略就是优势策略。在任何博弈中,我们都应该倾向于选择优势策略,避免劣势策略。

智猪博弈

智猪博弈的背景是:一头大猪和一头小猪生活在一起,大猪去碰按钮后投下食物两头猪会一起吃,而若是小猪去碰按钮,还没跑到食槽,投下的食物就已经被大猪吃完了。

寻找并应用优势策略

对于小猪来说,可以选择的策略有: 1. 去碰按钮,但是食物被大猪吃完;2. 不碰按钮,等大猪碰了之后和大猪一起吃。 所以对于小猪来说,不管大猪如何选择,小猪的优势策略是策略2。

对于大猪来说,可以选择的策略有: 1. 去碰按钮,和小猪一起吃; 2. 不碰按钮,等小猪碰了之后吃完所有的食物。 所以大猪的优势策略是策略2。

寻找并避免劣势策略

但是如果大猪选择策略2,小猪选择策略1.最终的结果是2头猪都饿死。这对于2只猪来说都是最差的策略。所以大猪只能选择策略1。和小猪一起吃。