要学习博弈论,应该先了解“囚徒困境”这一博弈结构。这是非常有名且极具代表性的博弈之一。
在一起盗窃案件中,两名嫌疑人被逮捕了,即囚徒A和囚徒B。但是,要想判决两人有罪又证据不足,为此,警察将两人分别关在不同的囚室,并向A和B提出了相同的交换条件:
①假如你招供了,但你的同伙沉默,那么你将无罪释放,你的同伙将被判3年有期徒刑。
②假如你沉默而你的同伙招供了,那么你将被判3年有期徒刑,同伙无罪释放。
③假如你和同伙都招供了,那么两人都被判2年有期徒刑。
④假如你和同伙都沉默,那么两人都判1年有期徒刑。
我们来分析两个囚徒的利害关系,首先,将可能出现的所有情形归纳为图2-1。“囚徒困境”博弈中有囚徒A和囚徒B两个局中人,各自有两种选择(沉默和招供),可能出现的事态共有四种(2×2=4)。
写有数字的四个格,对应可能出现的四种事态。上面那一行代表囚徒A沉默的情形,下面那一行代表囚徒A招供的情形。与此对应,左右两列是根据B的选择来划分的(左边为沉默,右边为招供)。囚徒A选择了“招供”、囚徒B选择了“沉默”时,就对应图表中左下方的格子。
这张表的特征就是每一个格里都写有两个数字。左边的数字(黑色)表示囚徒A的利益,右边的数字(红色)表示囚徒B的利益。用数字表示利益,这样一来,对于两个囚徒来说,哪种局面更好就一目了然了。在博弈论的分析里,这个阶段是最重要的。
站在自己或者对方的立场, 用数字来恰当地表示利害得失。即使不能正确地理解数字也不必担心,只要能清楚地将整个事态的优劣标明即可。
徒刑年数因出现的事态的不同而不同。对于囚徒来说,被判刑的年数当然越少越好。所以,表格中无罪的场合用“0”表示,用“-1”“-2”“-3”来表示判刑的年数。
至此,都是为了正确理解博弈的结构。
如果不懂得博弈论,很可能难以把握选择“招供”或“沉默”之后出现的情况。但是,利用博弈论就可以俯瞰整个结构,包括对方的立场,并考虑到这四种情况。
在博弈论中,按照这样的步骤把握博弈的整个结构,是非常重要的。
那么,假如你是囚徒A,你会采取怎样的行动?
你有可能会因为不清楚对方的行动,无法前进。但是,如果懂得博弈论,就无须犹豫,直接进入下一步思考 , 根据对方的态度采取最佳行动。
①囚徒B招供的情形
在囚徒B招供的情况下,囚徒A也招供的话,就是“2年有期徒刑”(-2);如果囚徒A选择沉默的话,结果是“3 年有期徒刑”(-3)。
“2年有期徒刑”和“3年有期徒刑”相比,囚徒A会毫不犹豫地选择招供“2年有期徒刑”(-2)。如果对方(囚徒B)招供,囚徒A应该采取的行动是“招供”。
② 囚徒B沉默的情形
设想一下囚徒B沉默的情况。囚徒A选择招供的话就是“无罪”(0),选择沉默的话就是“1年有期徒刑”(-1)。
即使在这种情形之下,囚徒A也应该招供。因为招供的结果是无罪,沉默的结果是 1年有期徒刑,所以,囚徒A没有选择的余地。
也就是说,无论囚徒B招供还是沉默,从结局来看,囚徒A都是招供为佳,这大家应该很清楚了。
站在囚徒B的立场上也同样如此。无论囚徒A采取了什么样的行动,囚徒B都是招供为佳。
通过以上的推断,利用博弈论设想囚徒A和囚徒B的行动,就会想到“互相都会招供”。
这就是有名的“囚徒困境”博弈。
首先,要养成从逻辑上来思考并把握博弈的结构的习惯。囚徒A和囚徒B这两个局中人,要考虑受什么样的规则支配,并采取行动,或预测对方的行动。这就是博弈论的基本立足点。
如果仅从自己的立场考虑,就不可能正确把握博弈的结构。也要认真思考对方的想法及行动,并对照规则进行思考。