海天

注册日期:2012-05-22
访问总量:936997次

menu网络日志正文menu

谎言博弈与行为挣扎


发表时间:+-

四月一日“愚人节”,是需要如兔子般竖起耳朵,随时提高警惕的一天。媒体上,朋友间,谎话笑话大话堂而皇之来敲门,不小心就要被蒙一把。

其实,专门找一天来做”愚人节“,本身就有点黑色幽默。人们哪一天不是生活在谎言之中呢?据说有研究发现,一个成年人有意无意,平均每天要说六次谎话,这说的还是以绅士之风著称于世的英国。到了那视说谎为生存法则的人群地界,谎言与真话要分家都难了。反正有黑谎也有白谎,说谎是如此的实情常态,人们说几句假话,通常脸儿不红,心儿不慌,鼻子更不会变长。

一部人类史,既是追求真理和进步的文明史,也是充满谎言和欺诈的争斗史。

说谎既是人性的一部分,识别真实与谎言便是必需的本能。生存和发展的需要要求人们必须相互信任,合作共生;但是碰到资源短缺或矛盾激化,尔虞我诈就少不了,应对不当,轻则蒙受羞辱,重则血本无归。无欺不入戏,无谎不成真。诚信与欺骗,合作与背叛,凸显人类本性,既是文学戏剧中不可或缺的元素,也是博弈论和行为科学研究的话题。

game pic 1.jpg

1459711306529721.jpg英国有个风靡一时的电视游戏节目《金球(Golden Balls)》,以展示压力与诱惑下人们的行为反应为看点,在同类节目中也算出名。节目设计颇为复杂,简单地说,每场开始有四名选手参加,经过三轮考验和互相角力后,剩下两名选手和累积下来的一大笔奖金,进入最后的“Split or Steal(分还是偷)”环节。这时,主持人会给每人发两个球,其中一个里面写着Split(平分),另一个写着Steal(偷窃),每人只能各自选定一个球,然后两人同时打开 --

  • 如果两个人都选择了Split(分),那么两人就可以平分之前累积的奖金,皆大欢喜;

  • 如果两个人都选择了Steal(偷),那么谁都得不到一分钱;

  • 如果其中一个人选择平分, 而另一个人选择偷窃,那么后者就偷成了,可以拿走全部奖金,而选择平分的那个好人只能空手而归。

1459711312972277.jpg

这很容易让人想起博弈论中著名的“囚徒困境”【注1】,不过稍有不同。在“囚徒困境”中,如果囚徒甲判断同伙乙有可能坦白交代,那么他自己选择坦白以求从宽,就是一个明确的优势策略;双方都遵循这个策略,达成纳什均衡【注2】。而在“金球”游戏中,如果一方选择“偷窃”,那么另一方就没有机会赢到钱,谈不上能有什么优势策略。所以问题的关键就是如何争取到对方答应合作,选择“平分”。

与典型的背靠背“囚徒困境”不同,“金球/分还是偷”游戏在各自作出选择前,有一、两分钟的时间,允许两人沟通商量。这是最后的心理战,也是最有趣的看点。人们常常看到这样的情景 -- 两名参赛者互相说服着:咱们肯定都选Split啊,合作共赢,走共同致富之路!而且相互保证着:握住我的手,看着我的眼睛,听着我诚实的心跳,相信我的誓言,一定跟你平分!

那辰光,每个人都竭力要使对方相信自己,却一点都少不了猜疑对方。当你的成功取决于对方的合作,你怎么才能知道,对方是在撒谎还是值得信任?直到两个球同时打开的那一刻,结果究竟如何,谁心里都没底。

(示例1)

(示例2)

金球揭开,尘埃落定。从上面两段视频中我们可以看到,双赢无疑是最好的结果,参赛者不仅可以获得不菲的奖金,更可以骄傲于自己信守承诺,且对对手判读准确。 而偷袭成功独吞奖金的赢家,窃喜过后,面对以诚信待你却被你占尽便宜的对手,却往往抬不起头来,最先说的一句话总是“对不起”。在我看来,这般当面撒谎,出尔反尔,损人利己,纵使赢了奖金,又有什么快乐荣耀可言?不过“金球”的主持人会迅速把话岔开,提醒你这是游戏规则,非战之罪。对做我这般冬哄之想的人,恐怕连参加游戏的资格都不给你。

这个内涵丰富的游戏,自然引起了行为科学家的兴趣。行为金融学创始人,著名的芝加哥大学商学院Richard Thaler 教授等收集了2007-2009年间287期“金球”节目,对参赛者的行为表现进行了数据分析,有一些非常有意思的发现,比如 -- 

  • 所有参赛者中,有近53%选择“平分”,比例略高于决定“偷窃”的一伙;

  • 综合统计,有31%的时候参赛者达成双赢(两人同选“平分”), 25%的时候双输(两人同时选择“偷窃”),一人赢一人输的情况出现最多,高达44%

  • 奖金数额较少时,参赛者更倾向于选择合作;桌面上摆的钱多了,人们的自私和贪欲也要随之上升。年龄和性别对选择倾向有一定影响。年轻男性更倾向于选“偷窃”而不是合作,这种情况随着年龄的增长逐渐逆转,即中老年男子的合作精神更强;女性群体中则没有观察到明显的年龄影响;

game pic 3 H.jpg

  • 其他人口因素(如种族,地域,受教育程度等)与选择倾向相关性不大。例如,受教育程度比较高的,选择合作共赢不撒谎的比例,比受教育程度较低的高不了多少;

  • 如果对手在前面的游戏环节中曾经对自己有过敌意举动,参赛者会呈现一定的报复心理,倾向于不合作。明确宣示自己强烈的合作倾向者,更可能信守诺言选择“平分”。然而,参赛者的选择比较独立,不少人来参赛前就决定好了届时选偷还是选分,并不大会受临场对方态度言语的影响。

最后这一点我觉得很重要。它表明,一个人选择诚信合作,还是选择欺骗以占得上风,取决于他的信念系统,很多因素考量根本就在游戏之外。当然,上面这些研究都从行为科学的角度看问题,博弈论则有不同的关注。

让我们回头再来分析一下这个游戏的玩法。当一个参赛者力劝对手选择合作平分的时候,实际上是在给对方呈现这样一个预期:

1459711313291478.jpg

你想强调的是“合作共赢,双偷皆输”的道理,而从对方角度,如果你选择平分,那么“偷”对他就充满诱惑力。“偷”对他而言是个略优策略,相对不败,弄得好可以独吞奖金,弄不好也没让你独占便宜。这种考虑对双方都是成立的,所以往往到最后,至少有一个人选择不合作,即“偷”。用博弈论的术语来说,双方都寻求合作,是一种不稳定策略

就这样,“金球”游戏靠着几条简单的规则,一大堆闪亮的金钱,和众人无法实现均衡的博弈策略,玩弄着人们的贪婪;在信任与怀疑的挣扎中,展示着人性的弱点。日复一日,年复一年。直到2012年,“愚人节”刚刚过后的某一天。

这一天,“金球”游戏进行到最后的“分还是偷”环节,奖池总额13,600英镑。相对而坐的,左边是Ibrahim Hussein,目光犹疑,闪烁不定;右边的是Nick Corrigan, 目光坚定,自信满满。

1459712518355871.jpg

主持人解说游戏规则之后,由Nick先发言 --

Nick:“Ibrahim, 我要你100%地相信,我将选择‘偷窃’,我要你选“平分”,我答应你,下了台后我会跟你平分奖金... 如果你选“偷”,咱们两人都会空手离开。

Ibrahim(显然完全出乎意料):“我没听错吧?你的意思是,你选偷,我来选分,让你把钱赢走,你事后再跟我分?

台下观众一片爆笑,有几位金发女郎笑得眼泪都要出来了。是啊,好一个笑话!

Ibrahim:“不如这样吧,咱们都选‘平分’,咋样?

只有让游戏回到熟悉的轨道,Ibrahim 才能在错愕中找回判断的感觉【注3】。

Nick: “我不会选‘平分’,我100%会选‘偷’。我是一个诚实的人。

Ibrahim:“你这脑子怎么长的?从小我爸爸就教育我,男人不守诚信,就一文不值。”【注4】

Nick: 说的没错。我是一个正派的人。我会选‘偷’,我答应把赢的钱跟你分享

主持人见缝插针提醒道,台下交易可不保险,要确保能赢钱,只有两人都选“平分”。Ibrahim 终于绷不住,发火了:

你是个白痴!白痴!本来咱们可以平分的,现在谁都一分钱拿不到!统统输光!

然而,可怜的Ibrahim现在还能做什么呢?Nick 旗帜鲜明要选择“偷窃”的表态,已经改变了他面对的格局。无论如何,Ibrahim已经没有赢钱的可能,但是Nick给绝望中的他开了一扇天窗,露出一线希望,信不信由你。这一点点希望,便是打破僵局的砝码。无论Ibrahim如何愤怒,只要他还能做一点理性思考,就会做出唯一合理的选择:平分。

1459711314999981.jpg

所谓“纳什均衡”,就是在非合作博弈状态中,有这样一种组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应,任何参与人单独改变策略都不会得到额外的好处。Nick明确选择“偷窃”的策略,迫使Ibrahim 唯有选择“平分”,这是一组稳定的策略组合,达成纳什均衡态。它不一定是最优化策略,但是稳定可期的;不论对手是个天使还是混蛋,都不能动摇他对局面的控制。

台下那些嬉笑的观众不知道,“金球”节目播出了四、五年,几百期到此刻,“分还是偷”的魔咒已被Nick精彩破解!

然而,真正的精彩却在最后!

双方开球,揭晓时刻,Ibrahim 果然选择了“Split”,而Nick最后亮出的,竟然是--

1459711313550034.jpg

S P L I T ! 平分!

小人常戚戚,君子坦荡荡。先小人而后君子,堪称电视博弈游戏史上最精彩的“谎言”!

我为Nick的表现深深折服。他展现的,岂止是高超的博弈策略,对对手的精准判读?“谎言”背后,更闪耀着高贵的人格光辉!

相关博文:

以你的聪明博弈群体的理性


【注1】囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

  • 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

  • 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

  • 若二人都互相检举(互相“背叛”),则二人同样判监2年。

两名囚徒由于隔绝监禁,并不知道对方选择。试设想困境中两名理性囚徒会如何作出选择:

  • 若对方沉默、背叛会让我获释,所以会选择背叛。

  • 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。

【注2】纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰?纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确 定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。

【注3】赛后访谈中,Ibrahim 亲口承认,他原本一直打算要选“偷”的,因为他宁可两个人什么都得不到,也不愿被对手占便宜涮一把,实在太尴尬窝心:“I was always gonna steal … the reason being, if I split and the other guy steals, I get nothing. I’d rather both of us walk away with nothing, than someone embarrass me [by stealing when I split].”

【注4】赛后,Ibrahim 还承认,关于父亲教育他要守信这段话全是编的。他从小是被母亲养大的,从未见过自己的父亲。


浏览(4466)
thumb_up(10)
评论(42)
  • 当前共有42条评论
  • 海天
    <p>绿岛MM好!你可是真正直接的电视观众啊,不像我们,现在只能看看油管上的零星视频,隔山买牛。谢谢分享你的第一手印象和观感。毕竟是上 National TV Show, 人们对自己的表现留给别人的感觉,还是会有所顾忌的,只不过不同的人侧重点不同,荣誉感 vs 羞耻心,而奖金多少会悄悄地改变心理上的平衡点。</p>
    屏蔽 举报回复
  • 绿岛阳光
    <p>海天分析得很精彩,大赞!这个节目英国电视台很多年以前播出的,我几乎每集都看,现在几乎都全忘记了。这个节目里有人性和理性的博弈,呵呵。 不过,电视上播出,为了区区小钱公开撒谎的人在英国社会会被同事小瞧的,因为这个节目最后的奖金是二人联手挣得的,还有运气的成份,有的最后只有几百镑的奖金,也有两人都选择偷,得到一片嘘声呵呵</p>
    屏蔽 举报回复
  • 海天
    <p>Typhoon: 已经说过的话,没什么必要重复。</p><p>关于“破解”,我文中讲得很清楚,Nick破解的是 
    "分还是偷的魔咒",就是他之前的参加者们不断钻进去的策略陷阱。看懂本文的叙述层次,这一点不难理解。你说如果Ibrahim可以反其道而行之,这是有
    道理的疑问,我在前面的一个回帖中已经谈过这个问题,拷贝如下,不赘叙 -- <br/></p><p>"我最早看过Nick这一段,就想,这是不是
    ultimate 
    solution啊,以后大家都用这招,还怎么玩啊?其实细想想,Nick这致胜的一招,虽然从博弈策略上是肯定正确的,但毕竟只是依赖于一点点微弱的诱
    惑(缺乏契约的保护),出其不意打破了僵局,在真正的游戏中就不一定可以重复。比如大家都知道了这个玩法,下一次Ibrahim对Nick说,不行,把桌
    子掉个个,我偷你分,下去我给你钱,Nick会愿意交出主动权吗? 
    终点又回到起点。这跟我上面提到的,重复发生的囚徒困境与单次的策略不同,有相通之处。这个节目在Nick之后一年左右确实就停播了,跟Nick 
    是不是有关系我不知道。不过我觉得Nick的精彩表现,从策略到人品,已经难以超越了。作为观众,我会觉得没必要再看更多了。”</p><p><br/></p><p>“囚徒困境”在它严格的定义和框架之内,自然难以破解。要破解,必须改变一些重要的相关条件,比如payoff,在国际政治军事中也不例外。阿妞前面的评论中有提及这个方面。</p><p><br/></p>
    屏蔽 举报回复
  • typhoon
    <p>不过话说回来,用 game theory 来模拟人的行为还是个有趣的课题。有人喜欢谈政治,那么咱们用这个来看看东西方军备竞赛的问题。其实对世界和平,全球环境乃至子孙后代都最有利的做法是大家都减少军备。</p><p><br/></p><p>可是因为一方觉得如果单方面放弃,对方会利用自己的放弃而增强军备,那么好意反而会对自己造成危险,因此双方都只能继续增强军备。双方都为了自身利益而不得不做其实是对自己的不利的事,这就是这个节目里双方都偷,和“囚徒困境”的结果。因为面对这种选择,几乎所有人都会选择“偷”。</p><p><br/></p><p>但这种情况能够靠 Nick 所做的这个明确告诉对方他将“偷”,但最后在台下会分给“对方”一半的承诺所打破吗?显然不能。否则这世上就不会存在那么多问题,楼上的阿牛也不正深陷同样的“囚徒困境”之中,欲罢不能么? <img src="http://img.baidu.com/hi/jx2/j_0057.gif" _src="http://img.baidu.com/hi/jx2/j_0057.gif"/></p>
    屏蔽 举报回复
  • typhoon
    <p>是吗?我怎么觉得能够从事先录制的编导节目中节目嘉宾的表现居然能看出“<span style="font-family: 'Times New Roman'; font-size: medium; white-space: normal;">闪耀着高贵的人格光辉” 的才是一种遗憾?</span></p><p><span style="font-family: 'Times New Roman'; font-size: medium; white-space: normal;"><br/></span></p><p><span style="font-family: 'Times New Roman'; font-size: medium; white-space: normal;">不过这并不是真正的“破解”了这个游戏理论。要知道这个把戏可一而不可再,只是一次性的。再者就是如果当时 Ibra 也采取同样的态度,就是说 Nick 我和你一样诚实,还是我来“偷”,你来“分”,事后我也一定分给你,</span><span style="font-family: 'Times New Roman'; font-size: medium;">那结果还不是一样? <img src="http://img.baidu.com/hi/jx2/j_0057.gif" _src="http://img.baidu.com/hi/jx2/j_0057.gif"/></span></p>
    屏蔽 举报回复
  • 海天 回复 雨露
    雨露好!确实很久没有见到MM的身影,时时还念起。我前段时间曾经计划春假的时候去走大圆环,把你的游记看了又看,可惜后来没有成行。MM最近的春假又去了哪里?
    屏蔽 举报回复
  • 海天 回复 typhoon
    在没有清晰优势策略的游戏中,实际结果大致符合概率分布,这个没什么奇怪。其中不同区间不同因素组合下的分布偏差,才是有意思的研究点。至于电视台有意编排结果,为了少付奖金是难以成说的,原因呢阿妞已经讲得很清楚了;为了故弄玄虚提高收视率则是猜测,从你的论述中得不出这个结论。这个节目的设计已经非常精妙,深谙人性与博弈精髓,可以保障系统自身稳定运转;把制作方看成赌场,也不存在大笔赔钱的系统误差。在这种情况下,人为介入随便调整基本不可能。因此而不能认识到Nick的表现中所闪耀着高贵的人格光辉,只能说是一种遗憾了。
    屏蔽 举报回复
  • 海天 回复 道还
    道还:谢谢回来!这个节目啊,说起来还真不是英国人自己设计的,设计者其实是荷兰人。这不由得使我想起,唱歌比赛节目“The Voice” 最早也是由荷兰人设计推出的,后来被全球多个国家引进,包括美国,和“中国好声音”。
    屏蔽 举报回复
  • 海天 回复 lone-shepherd
    哦,牧人还有这样的学习经验,难怪讨论起经济学来满腹经纶,头头是道的。学分和学位到了一定时候,差不多就是浮云了。现在有很多好的网课,如果有感兴趣的专题可以看看。
    屏蔽 举报回复
  • 海天 回复 雪山下的绛珠草
    雪草:这样啊?我很少去论坛的。昨天你那篇文章,我在博客列表和到你院子里找了半天。博客里文章多几篇有什么关系呢,不需要就隐藏好了,或者换成自己想收藏的东东。
    屏蔽 举报回复