今天我们来讲博弈论中一个非常经典的模型,叫做囚徒困境。两个人因盗窃被捕,警方怀疑其有抢劫行为,但未获得确凿证据可以判他们犯了抢劫罪,除非有一个人供认或两个人都供认。即使两个人都不供认,也可判他们犯盗窃物品的轻罪。犯罪嫌疑人被分离审查,不允许他们之间互通消息,并交代政策如下:如果两个人都供认,每个人都将因抢劫罪加盗窃罪被判2年监禁;如果两个人都拒供,则两个人都将因盗窃罪被判处半年监禁;如果一个人供认而另一个拒供,则供认者被认为有立功表现而免受处罚,拒供者将因抢劫罪,盗窃罪以及抗拒从严而被重判5年。
我们用盈利表将两人面临的博弈问题表示如下:
从图中可以发现,如果两个囚徒都拒供,则每个人判0.5年;如果每个人都供认,则每个人判2年。相比之下两个囚徒都拒供是一个比较好的结果,但是这个比较好的结果实际上不太容易发生。因为每个囚徒都会发现,如果对方拒供,则自己供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是比较好的选择;如果对方供认,则自己供认将被判2年,而自己拒供则会被判5年,因此供认是比较好的选择。
无论对方拒供或供认,自己选择供认始终是更好的,这就是囚徒困境。由于每个囚徒都发现供认是自己更好的选择,因此博弈论的稳定结果是两个囚徒都会选择供认。我们把这种结果称为博弈的纳什平衡。
囚徒困境通常被看作个人理性冲突和集体理性冲突的典型情形。因为在囚徒困境局势中,每个人都会根据自己的利益做出决策,但是最后的结果却是集体遭殃。
我们不难发现,当每个人追求自己的最大利益时,社会和团体不一定会达到它的最大利益,这种情况在现实中有很多相似的例子。
美苏争霸的时候,美国和苏联如果选择合作,同时削减核武器的开支,对两国将是最好的选择。但是由于不确定对方的选择,美国和苏联同时选择投入更多经费研究核武器,最后间接导致了苏联的解体。
也许有人会问,难道囚徒困境真的是一个走不出的困境吗?其实也不然,这里就给大家支招看看能不能走出囚徒困境。假如每一个拒供的囚徒都可以在刑满释放后对供认的囚徒实施报复,那么每个囚徒就可能因担心未来的报复而在现在选择拒供,使得拒供成为平衡的结果,合作达成了。不过这种合作是脆弱的,警方可以轻易摧毁此类合作。
由囚徒当事人的报复机制形成的合作虽然脆弱,但是却提供了一条走出囚徒困境的可行思路。只要对囚徒不合作行为的惩罚是足够的并且可信的,那么就可以使囚徒的行动转到合作的轨道上来。
现实中的确有很多犯罪团伙的成员被捕后拒不坦白,很大程度上与一个由第三方实施的惩罚机制有关。因为在犯罪团伙中如果出卖兄弟,将永远无法在江湖立足,并且其家人也将受到黑社会的追杀。正是这样的第三方惩罚机制,使得报复和惩罚是可信的,从而促成了囚徒的合作。