基于裁判博弈的囚徒困境解决方案分析及在人力资源管理的应用_人力资源管理论文

时间:2021-04-06 作者:stone
后台-系统-系统设置-扩展变量-(内容页告位1-手机版)

摘要:传统博弈都是博弈参与者都参与的博弈,本文讨论一个新的博弈模型:出现一个新的“裁判”,这个裁判既不参与博弈,也不定出博弈规则。这个裁判只是在博弈各方博弈产生结果时,这个裁判才会奖励博弈胜出方。这样的博弈定义为:裁判博弈。本文基于裁判博弈对囚徒困境进行了讨论,对裁判博弈下的囚徒困境通用解法进行了论述。本文认为囚徒困境不是两人博弈,而是警察参与的三人博弈,是裁判博弈的一种情况;囚徒困境也不是两人博弈下的纳什均衡,而是属于全新的均衡类型:裁判博弈均衡。本文基于裁判博弈下的囚徒困境分析,讨论了其在人力资源管理的应用。

关键词:裁判博弈博弈论纳什均衡人力资源管理

中图分类号:F224.32文献标识码:A

一、引言

囚徒困境是博弈论中一个重要的博弈案例,在博弈论文献中被广泛讨论,并且被扩展到管理、经济等领域。囚徒困境描述的是这样的一个博弈:

两个犯罪团伙成员被警方抓获,他们分别被关在不同的审讯室接受警方的问讯。他们被警方告知:如果一个人坦白,另一个人不坦白,坦白者获释,而不坦白者将被关3年,如果两个人都坦白,每个人将被关2年;如果两个人都不坦白,每个人将被关1年。

目前为止,世界所有的博弈论论文都认为这是一个“困境”,这个困境让两个囚犯陷入为难之中。据笔者所查,所有的博弈论文献都是认为这个博弈是一个纳什均衡,即两个参与者都会选择坦白;所有博弈论文献也都认为这是一个两人博弈。

本文作者认为:这不是一个两人博弈,而是三人博弈;这不是一个纳什均衡,而是一个基于裁判博弈下的“裁判均衡”;这不是一个很难解决的“困境”博弈,而是一个“裁判博弈”的典型案例。这个博弈的利用不仅是用在如何解决囚徒的“困境”,而是如何充分讨论“裁判”的收益,再应用到管理、政治、经济等其他学科领域。这样解决囚徒困境,将是一个划时代的转变,对博弈论中这个典型的博弈进行一个彻底的思考,把这种博弈思想应用到相关学科,将对管理、经济、政治等学科将是一个突破性的理论突破。

二、囚徒困境的类型

为什么囚徒困境不是一个两人博弈?

在囚徒困境这个博弈中,除了两个囚犯外,还有一个警察!所有博弈论文献在讨论这个典型的博弈时,都认为这是两人博弈,并且最终的纳什均衡的结果是两个囚犯都坦白。那么两个囚犯都坦白,最大的收益方是谁?是警察!因为只有两个人都坦白,才能让警察的利益最大化。既然博弈中,有个利益最大化的第三方,为什么这个博弈是两人博弈?很明显,这是三人博弈。在这个三人博弈中,警察是规则制定者,我们可以认为,警察是两个囚犯的裁判,也就是,两个囚犯在博弈结束后,由警察来最后执行博弈的结果。在博弈中,两方博弈,而有第三方作为裁判的博弈,我们定义为裁判博弈。

为什么囚徒困境不是一个两人博弈纳什均衡?

按纳什均衡的理论,达到纳什均衡的结果是,所有博弈方都是理性人,在博弈各方都是理性的情况下,所有各方都获得利益最大化,这样的均衡就是纳什均衡。

由于第三方警察的介入,这已经不是一个两人博弈,而是三人博弈,在三人博弈情况下,纳什均衡发生了严重的变化。在这个三人博弈中,两个囚犯既然也都是理性人,博弈结果应该是这样的:两个囚犯都是理性的,都想获得利益最大化,他们都明白,博弈规则的制定是警察,这个规则很明显是为了达到警察的利益最大化。于是,两人完全能明白,坦白是警察所需要的,并且每个囚犯都会明白,另一囚犯也是理性的,并且一定也能考虑到警察的目的,并且能考虑到另一个囚犯也能知道自己的想法。鉴于两个都是理性的,其中一个囚犯就会采用不坦白,并且他也会想到另一个囚犯也同样采用不坦白,这样,警察的利益没有达到最大化,两个囚犯同时达到了利益最大化,两个囚犯将只需关1年。

在这个三人博弈中,警察只定出规则,然后并不再做任何策略,而是等待两方采用各自的策略,警察是裁判。两个囚徒做出策略时,可以考虑另一个囚徒的策略,也可以考虑警察的目的,而不用考虑警察的策略,因为警察除规则制定外,不做任何策略。既然这样,这个博弈的最终结果就应该是:两个囚徒都不坦白。如果两个囚徒选择了坦白,说明两个囚徒没有考虑到第三方博弈参与者,也就是警察,这是不理性的。显然,这是与纳什均衡及所有博弈论的假设冲突的。所以,囚徒困境不是一个纳什均衡,只能是一个全新的均衡:裁判均衡。

三、裁判博弈模型

现在我们先看一下我们设定的博弈模型:

第一个裁判博弈模型:

假如有A、B和C三人,其中A和B之间有一场博弈,而C是裁判,C只会根据自身的利益而制定出一套规则,让A和B根据此规则来进行博弈,而C不参与博弈,在A和B博弈过程中,C也没有任何策略出现,仅仅是在A和B博弈结束后,对博弈后的A和B根据制定的规则进行处理。这个模型就是裁判博弈,囚徒困境完全符合这个博弈模型的所有特征。

那么,对这个博弈,我们要得到它的解,应该如何进行呢?是A胜还是B胜?还是C胜?

四、博弈模型分析及解决方案

裁判博弈的结果有三个:基于裁判利益最大化的博弈结果、基于两个囚徒利益最大化的博弈结果和基于某一个囚徒利益最大化的博弈结果。

第一种结果:基于裁判利益最大化的博弈结果。

这个博弈结果也就是目前博弈论文献中讨论的囚徒困境的结果,也就是两个囚犯都选择坦白。出现这个结果的前提是:两个囚犯都不考虑警察的存在,完全按照两人博弈来进行。因为每个一囚徒都考虑自身的利益最大化,因此,同时,两个囚徒在选择博弈策略时,同时忽略了第三方参与者,也就是警察的存在,没有考虑这个裁判的利益及目的。

忽略裁判的囚徒困境博弈结果-一般认可的纳什均衡

这个博弈结果虽然是目前博弈论文献中普遍认可的结果,但是,作者认为这有失博弈论的基本假设:所有博弈者都是理性的,所有博弈参与者都是为了让自己获得利益最大化。因为两个囚徒在博弈做出策略时,并没有考虑所有博弈参与者的策略和利益,也就是没有考虑警察的利益。虽然警察没有采用任何策略,但警察在两个囚徒博弈前制定了两个囚徒的博弈规则,实际上还是参与了整个博弈,并且这个规则制定过程中,一切都是为了让警察获得利益最大化。

第二种结果:基于两个囚徒利益最大化的博弈结果。

因为博弈三方均是理性的,都是为了自身获得利益最大化。

警察作为裁判,他首先会考虑到自身利益。为了让自己利益最大化,他必须根据知道一个规则一个对自己最有利的规则:如果一人坦白,另一个人不坦白,坦白者获释,而不坦白者将被关3年;如果两个人都坦白,那么他们会被判2年;如果两个人都不坦白,每人将被关1年。

作为囚徒,为了让自己的利益最大化,他们必须充分考虑另一个囚徒和警察的利益及策略。以下是两个囚徒的策略及相关方的收益。

三人博弈下的囚徒困境的博弈结果-裁判博弈均衡

由于两个囚徒在选择策略时,警察并没有任何策略,因此,在两个囚徒做出各自的策略时,不用考虑警察的反制策略,同时也能完全想到另一个囚徒也是理性的,所以,理性的选择是可以让警察的利益最小化,同时又选择让自己的利益最大化,这时,博弈的结果就是两个囚徒都不坦白。这也是一个均衡,这个均衡我们命名为:裁判均衡。第三种结果:基于某一个囚徒利益最大化的博弈结果。为了得到这个博弈模型的解,我们不得不引入以下假设:

一、A为我方,B为敌方,也就是另一个囚徒。

二、A方在博弈中必须获胜,必须利益最大化,而B必须输,B最后的利益最小化到什么程度都不是我方考虑的因素。

基于以上假设,为了获得利益最大化,为了使得A方胜,我们必须在B没有采用任何行动或策略的情况下,主动出击,采用主动设计的策略,直接攻击B,从而让A方获得利益最大化。因此,博弈的过程主要就是A方采用什么样的策略来攻击B,在A方首次采用行动时,是不考虑B采取的行动的。当A方首次采用行动后,B方采取行动或策略时,A方再进一步采用相应的行动或策略。

裁判博弈的简单模型如下:

从裁判模型我们能看出,C不在博弈参与方之内。因为B方没有采取行动或策略,A方应采取主动行动或主动策略。那么,A如何采取主动行动或主动策略呢?我们认为,A方应该采用以下的步骤,再决定采用下一步的行动或策略。

第一步:列出A、B、C三方所有的相关关系的人或物。如下图。

现在博弈方式就变成了以下情况:

这时的博弈状态发生了变化,博弈参与者不再是A和B,而是A、B和C所有相关因素都是参与者了。这时,也就是相当于A和B并不是博弈的参与者,而A、B和C的周围因素成可博弈参与者。

裁判博弈的解题规则如下:

一、A如果想获得最大的利益,最好的方法是不博弈,也就是说,如果B能退出,A可以直接获得最大化的利益。在现实生活中就是利用A、B和C的周边因素直接让B退出博弈。退出博弈的方式有:由于条件的变化,B自愿退出,还有一种情况就是B死亡,B死亡,就是B的利益最小化的极限情况,这种情况一般出现在官场。我们据此可以推出,博弈的最高境界是:最厉害的博弈是不博弈。

二、A可充分利用所有相关因素,直接弱化B身边的因素,让B无法获得利益最大化。

三、A可充分利用所有相关因素,强化A身边的因素,从而使A获得利益最大化。

四、A可利用离间的方式,使A获得利益最大化。所谓离间,也就是A使用某种策略,让C和B间产生矛盾。

五、建立新博弈。建立新博弈的方法很多,可拉C或除A、B、C相关的所有因素之外的因素参与博弈,假设这个因素是D,主要目的是让D与B间产生博弈。

针对囚徒困境,在裁判博弈下,我们假设两个囚徒分别是A和B,而A就是我方,而B方为敌方。根据裁判博弈的解决规则,一共有以下解决方案:

一、最好的博弈是不博弈。这个方法的实现就是,使用A、B和裁判C(警察)身边的所有因素,使B退出博弈。使B退出博弈的方法有两个:证明B没有参与犯罪、B死亡、B出现相反身份。如果有警察能做出B没有参与犯罪,那就实现的B退出的一种方式,而使用某种方法让B死亡,也会直接导致B退出,第三种就是,有某个第四方证明,B为英雄,这时的B就不会再参与犯罪博弈,而他会守住他自己的英雄身份。

二、弱化B身边的因素。弱化的方法是:让B知道如果B揭发,B身边的人会受到很伤害,也可以让B知道如果B揭发,B会有更大的利益损伤。

三、强化A身边的因素。弱化的方法是:A身边的某个因素,能直接控制B身边的某个因素,使得B身边的这个因素利益严重受损。也可以是A身边的某个因素,能直接控制B的另一个最大利益。

四、离间方式。尽量让B与C间产生矛盾。例如,A可以主动交待B的某种行动,导致了C(警察)的利益受损。

五、建立新博弈。让第四方D参与与B之间的博弈。例如,出现D,如果B选择揭发,那么D会对B产生更大的利益损失。

五、博弈设计及裁判博弈的人力资源管理实例与应用在现实中有很多博弈表面上看是两人博弈,其实是裁判博弈。如果我们不是站在两人博弈的角度,而是站在三人博弈、站在裁判博弈的角度处理往往有意想不到的解决方案,这将是博弈论的新突破,也将是解决很多“困境”式博弈的新思路。

一、在人力资源管理方面,招聘时,企业可以事先制定一些裁判性的规则,让应聘的员工根据规则进行博弈,最后选择胜出者作为后备员工。在日常人力资源管理过程中,也可制定一些裁判规则,让企业管理者之间、员工之间、企业管理者与员工之间产生一些博弈,对企业的管理都会有意想不到的效果。

二、在薪酬管理方面也可以用裁判博弈是思维,制定一些裁判规则,以便让薪酬管理更加有效。

三、在绩效考核中,用裁判博弈的思维进行管理同样会有特别的效果。例如,一家企业对销售员工的绩效管理中规定是这样的:年完成3000万的销售,奖金30万元,超过3000万元,每增加100万元奖励10万元。按这个规定,每个员工只是看着3000万这个基数,所有销售人员间并没有博弈,对于一般销售者来说,他们的目标也就是3000万元,尽量超。事实上,这个3000万元的基数是不是定得太小了呢?是不是经过不太大的努力就能完成?是不是如果一个人特别努力可以销售到5000万元?这一切都有可能。

那么企业应该如何做?企业应该制定一个裁判博弈规则,让所有销售人员之间有一个博弈,让销售数字尽量达到可能到达的最大数,这样企业才能获得利益最大化。假设规则这样定:不以任何基数为准,对第一名进行奖励30万元,外加奖金:第一名销售数与第二名的差距的10%;第二名奖励20万元,外加奖金:第一名与第三名的差距的10%,同时扣除与第一名差距的5%;第三名奖励15万元,外加奖金:第三名与第四名的差距的10%,扣除与第三名的差距的5%。这样一直往下执行。这样的结果就是:第一名会尽量让自己的销售成绩最好,第二名尽量缩小与第一名的差距并且尽量拉开与第三名的差距,而第三名会尽量追赶第二名,同时尽量与第四名拉开差距,……。博弈的结果就会是:销售数字也许可以远远超过3000万元。而企业付出的奖金也许比原来预算的还要少,用最少的成本达到了销量数的最大。

以上是裁判博弈在企业管理中的部分应用,以此抛砖引玉,相信在管理学上更多的方面可以应用基于裁判博弈下的囚徒困境。

六、结论

从本文的论述,我们可以得出:

囚徒困境不是一个两人博弈,而是一个三人博弈;囚徒困境不是一个两人博弈的纳什均衡,而是一个三人博弈的裁判博弈;囚徒困境的结果不符合正常的纳什均衡,而是具有三种均衡可能的裁判博弈均衡。

囚徒困境在现实中应用时,不能仅纠结于“囚徒的困境”,而应该站在裁判博弈的角度,考虑“裁判的利益”。也就是站在裁判的角度,如何设计一些困境,让除自己之外参与博弈的人在我方设计的规则中博弈,让裁判方获得利益最大化。在现实的人力资源管理方面如果能充分利用这个博弈,充分站在裁判的角度来考虑问题,很多很难解决的问题都会得到有效的解决。

参考文献

[1]AvinashK.Dixit,SusanSkeath,DavidH.Reiley.GamesofStrategy[M].WWNorton&Co;3rdRevisededition,2009

[2]JosephHarington.Games,StrategiesandDecisionMaking[M].WorthPublishersInc.,U.S.,2008

[3]RogerB.Myerson.GameTheory:AnalysisofConflict[M].HarvardUniversityPress,Reprint,1997

[4]Yong,H.P.,IndividualStrategyandSocialStructure:Anevolutionarytheoryofinstitutions[M].PrincetonUniversityPress,1998

[5]王宇.裁判博弈:相关第三方介入的博弈模型[J].企业管理.2015(4):111-113Dylw.net论文代写

[6]刘德海,王维国,孙康.基于演化博弈的重大突发公共卫生事件情景预测模型与防控措施[J].系统工程理论与实践.2012(5):937-946

[7]李子江.关于纳什均衡点的研究——1994年度诺贝尔经济学奖成果述评[J].学术研究.1995(2):43-49

[8]梁德翠.模糊环境下基于决策粗糙集的决策方法研究[D].西南交通大学,2014

[9]魏冠明.博弈论在管理理论中的应用局限和前景分析[J].山东行政学

后台-系统-系统设置-扩展变量-(内容页告位2-手机版)
声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:123456789@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关推荐

览?区域品牌声势夺人

览?区域品牌声势夺人作者:未知改革开放以来,在品牌建设领域,对内人们更多地强调产品品牌和企业品牌,对外则更多地强调国家品牌或国家形象。《参考消息》最近的一条消息说,中国包

后台-系统-系统设置-扩展变量-(内容页告位3-手机版)