首页 生活常识 正文

博弈和博弈 纳什均衡2求大神3如何突破困境实现共赢

纳什均衡原文发布于自己的博客平台【】具有竞争或对抗性质的行为称为博弈行为,其中以纳什均衡为代表的非合作性博弈理论在日常中最为常用。虽然有些时候选择的策略并不一定是全局的最优解,任何参与人单独改变策略都不会得到好处,最后囚犯A和B都会选择招供,B也会选择招供:那么大猪最后的决策还是会选择去按按钮,在每次参与者都只有有限种策略选择并且允许...

今天给各位分享博弈分摊的知识,其中也会对博弈和博弈进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录:

小白也懂博弈论:纳什均衡

原文发布于自己的博客平台【 】

具有竞争或对抗性质的行为称为博弈行为,并且博弈理论在经济学、国际关系、军事战略等很多领域都有广泛的应用,其中以纳什均衡为代表的非合作性博弈理论在日常中最为常用。

在很多场景下,比如玩德州扑克等游戏时,虽然有些时候选择的策略并不一定是全局的最优解,但却是相对于其他人的策略而做出的最优解,即每个人都是对自己最有利的解决方案,我们将其称为为 纳什均衡 。

纳什均衡(或者纳什平衡),Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要策略组合,以约翰·纳什命名。

再解释一下,所谓纳什均衡,指的是参与者的一种策略组合,在该策略上,任何参与人单独改变策略都不会得到好处,即 每个人的策略都是对其他人的策略的最优反应 。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

枯燥的描述很难理解,下面使用几个案例来理解下。

背景:有两个囚犯A和B,犯事儿进去了,然后警官对其分开审讯,所以A和B是没有机会进行串供的

奖惩:如果双双招供,则各判2年,如果双双不招供,则各判1年,如果一个招供一个不招供,则招供的人立即释放,不招供的人判刑十年

结果:最后囚犯A和B都会选择招供,所以各判2年,这个便是此时的纳什均衡。

但是明明双双不招供才是最优解啊,其实不然,回头再看一下概念,纳什均衡其实并不是全局的最优解,而是每个人相对于每个人的策略而做出的最佳策略,下面来解释下。

我们来建立一个数学模型,使用 -2、-1、0、-10 来形容上面的奖惩,见下面的分析图。

A的心路历程:

所以,不管B招不招供,A只要招供了,对A而言是最优的策略。

同理,对于B的心路历程也相似,B也会选择招供:

所以最终的结果是A和B都选择了招供。

即此时的纳什均衡点为:A和B都招供。

综述,敲黑板,纳什均衡的前提是: 决策圈中的个体是独立,不合作,不横向沟通的

背景:有两只猪,一只是大猪,另一只是小猪,然后有一个食槽,里面会有食物落下,但是需要去远处按一下按钮,每次按一下按钮,食槽中便会补满食物。但是呢,在按按钮的来回路上,是需要消耗一定的能量的。

奖惩:跑过去按一下按钮再跑回来吃食物,会消耗一些能量,记为 -2,每次食槽中补满食物,总食物量为 10份,大猪先吃的话能吃到 9 份,小猪先吃的话,大猪能吃到 6 份,一起吃的话,大猪能吃到 7 份

结果:大猪会选择去按按钮,而小猪会选择不去按按钮,即在原地等着。

小猪心路历程:

所以,不管大猪怎么样,小猪都会选择在原地等待。

大猪心路历程:

所以,表面上看,大猪的决策是受到小猪的决策所影响的,但是分析小猪的心路历程得知,小猪是不会去按按钮的,那么大猪最后的决策还是会选择去按按钮,这样大猪的收益才会最大化。

所以综上,最终结果是大猪去按按钮,而小猪在原地等待着。

即此时的纳什均衡点为:大猪去,小猪不去。

在每次参与者都只有有限种策略选择并且允许混合策略的前提下,纳什均衡是一定存在的。

比如选举、群体之间的利益竞争、会议中的法案竞争等,是必然存在纳什均衡的。

以公司间的价格战为例:如果对方一直降价,那我方继续降价必然会出现亏本买卖,然而如果不降价,也会出现失去市场的情况,损失更大,但如果对方不降价,我方更要降价才能谋得一丝丝利益,所以只要出现价格战,必然会两败俱伤,这是纳什均衡体现的必然结局。所以要改变这种结局,双方必须坐下来谈判寻求新的利益评估分摊方案,从而改变原先的利益格局(比如当年京东和当当的一场价格战,最终以双方各占某一方面的主市场从而获得新的利益分割方案)。

纳什均衡是基于非合作博弈论的平衡不动点解

例如上文的囚徒困境问题,如果两个囚徒是有合作的,则必然不存在纳什均衡点。

所以,在现实生活中,纳什均衡这一博弈是很重要但是也是很有限的,因为在很多情况下,即使知道平衡不动点必然存在,但是往往却很难找到。

纳什均衡(这一非合作博弈论模型)仅仅是突破了博弈论中的一个局限

因为在社会这一庞大的博弈环境下,还会掺杂着复杂的经济行为,虽然社会中的大家并非是集体合作性的,但在这种庞大的非合作性对象中,纳什均衡点是几乎不可能找到的。

纳什均衡属于NP问题

(摘自 wik i上面的一段话,暂时看不懂但却觉得很有道理)纳什均衡属于NP问题,Daskalakis 证明它属于 NP 问题的一个子集,不是通常认为的 NP-完全问题,而是 PPAD-完全问题。这项研究成果被一些计算机科学家认为是十年来博弈论领域的最大进展。

博弈论,求大神

因为F/N等于平均投入的钱数。参与人1的纯收入为U1(s1,s-1)=2F/N-s1 s1为参与人1投入的金额。 先假设人数无限大,可知,某一个人的策略(投入的金钱)对平均数影响是可以忽略的,我们姑且认为不变。这时我们由U1(s1,s-1)=2F/N-s1 发现,当s1=0的时候他的收益为2F/N是最大的。也就是说,s1=0是他的最佳策略。因为这是一个对称博弈。所以每一个参与人的最佳策略都是0既一分钱也不投。此时,我们可知,所有的参与人出于自己的利益都会选择一分钱也不投。那么此时0是否是最佳对策呢?我们发现当其他的参与人都选择策略0,参与人1选择投入s1时,F=s1,此时U1=2F/N-s1 因为我们假设了N无限大,所以此时2F/N=0 所以U1=-s1也就是说他投入多少亏损多少,此时最佳对策,仍然是选择一分钱也不投。于是我们发现所有 参与人都投资0元,此时这个策略互为最佳对策。用严谨一点的表述就是因为Ui(si,s-i)=2F/N-si 当si=0时Ui最大。既si=0=BR(s-i)且对任意参与人i成立。所以策略0是该博弈当参与人无限大时候的纳什均衡。

注意到,我只给除了参与人无穷大时证明过程的说明,可是当参与人并不多的时候呢?

你应该想到此时参与人i的策略si对平均数的影响也会很大了,鉴于此,我给出严格的数学证明,上述用于数学不好的朋友学习。

Ui(si,s-i)=[(F-si)+si ]×2/N-si=2(F+si)/n+2si/n-si 因为N>2,所以2si/n-si≤0

所以当si=0时Ui(si,s-i)=[(F-si)+si ]×2/N 为参与人i的最大收益,

因为该博弈是对称的,所以i可以属于任意参与人。由此可知,该博弈纳什均衡为每个参与人投资0元。

博弈论案例 分析

博弈论分析

一、经济学中的“智猪博弈”(Pigs’payoffs)

这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。

如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。

改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。

改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。

改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。

对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。

原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。

比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。

许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改变的个中道理。

二、囚徒困境博弈

在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’

dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。

表 囚徒困境博弈 [Prisoner's dilemma]

B 坦白 B 抵赖

A坦白 –8, –8 0, –10

A抵赖 –10, 0 –1, –1

我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。

要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。

博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。

话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判

10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。

这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。

不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”

这样的例子。如价格战博弈、军奋竞赛博弈、污染博弈等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略

(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。

美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家,他组织了一场计算机竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。关键问题在于,他们不只玩一遍这个游戏,而是一遍一遍地玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”。

“重复的囚徒困境”更逼真地反映了具有经常而长期性的人际关系。而且,这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次,则双方就建立了各自的历史档案,用以记录与对手的交往情况。同时,它们各自也通过多次的交手树立了或好或差的声誉。虽然如此,对方的程序下一步将会如何举动却仍然极难确定。实际上,这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何种举动都采取合作的态度吗?或者,它能总是采取背叛行动吗?它是否应该对对手的举动回之以更为复杂的举措?如果是,那会是怎么样的举措呢?

事实上,竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是,竞赛的桂冠属于其中最简单的策略:一报还一报。我把它叫做“以其人之道,还治其人之身”。

“一报还一报”的策略是这样的:它总是以合作开局,但从此以后就采取以其人之道还治其人之身的策略。也就是说,一报还一报的策略实行了胡萝卜加大棒的原则。它永远不先背叛对方,从这个意义上来说它是“善意的”。它会在下一轮中对对手的前一次合作给予回报(哪怕以前这个对手曾经背叛过它),从这个意义上来说它是“宽容的”。但它会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是“强硬的”。而且,它的策略极为简单,对手程序一望便知其用意何在,从这个意义来说它又是“简单明了的”。

三、价格战博弈

现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论

(vivalry

game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。

四、贸易战博弈论

这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。

博弈论案例分析

案例一:博弈论在企业人力资本投资中的应用[1]

一、引言

一个企业能否在市场中取得经济优势,依赖于企业科技优势、产品的市场适应性等等,而这一切又源于人才优势。因此,一个企业面临着如何尽可能地保持自己人力资源的优势,如何吸引优秀人才加入企业添加新动力,如何有效培训使己有员工获得技能的提高,如何使员工适应外部环境变化的要求,如何有效挽留公司的核心人才等等。但是统计调查显示,我国的培训现状不尽如人意。总体来看,我国企业培训管理的制度化、规范化程度有待加强,培训计划执行不力,培训效果跟踪与评价环节薄弱,培训对改善员工绩效的效用没有发挥,培训结果与员工晋升没有太大影响等。造成这种现状的原因固然是多方面的,其中一个主要原因就是人力资本投资收益的滞后性和不确定性,担心员工“硬了翅膀就飞走”,得不偿失。企业是否增加人力资本投资,员工是否留任企业,都是利益的博弈,结果是选择有利于自己的战略。本文用博弈论对企业人力资本投资作分析,说明企业应当进行人力资本投资和投资后应采取措施保证人力资本投资收益的获取。

二、概念和假定

1.概念界定

①人力资本。人力资本是通过投资于已有人力资源而形成的、以复杂劳动力为载体的、能实现价值增值的可变资本。

②企业人力资本投资。企业人力资本投资是指企业通过一定的投入(货币、资本或实物)获得人力资源,增加企业员工的知识、技能、健康水平,提高企业管理、文化水平和企业形象,从而提升企业人力资本存量,使企业经济效益提高的一种投资行为。

2.基本假设

①经济人。经济人假设是指无论是组织还是个人,追求自身利益的最大化。

②完全信息。完全信息是指信息是完全通畅的,不存在滞塞,而且客观存在的信息的获取是不需要成本的。

③物质资本充足。商品的生产总是物质资本和人力资本结合在一起进行的。

要使生产高效率的进行,物质资本和人力资本必须保持适当的比例。

三、人力资本投资与员工个人的博弈分析

本文从企业与员工之间的角度作人力资本投资的完全信息静态博弈分析,重点分析企业是否增加人力资本投资以及投资后如何行动。

假定在完全信息的条件下,企业和员工都是理性的。企业可以选择对员工培训或不培训。根据企业的选择,员工会做出留下或是转投其他企业的选择。假设企业不对员工进行培训是员工的收入为d,当企业选择培训,假设分摊到员工个人的培训费用为c,经过培训后多支付员工的薪水为e(e可以为零,即经过培训后不增加员工薪水),经过培训后员工为企业带来的收益增加值为b。又假设员工离职去另一单位获得的报酬为a。这里为了分析更简单一些,假设员工经过培训与未经过培训跳槽的收入一样,都为a。有时候培训后由于员工技能提高跳槽会获得更多的收入,但是并不影响下面的分析。企业培训博弈分析如表1所示:当b-c-e0时,即企业对员工培训后得到的收益增加值小于支出时,不管员工做出如何决策,企业都不会得到任何的收益增加值,因此企业是不会对员工进行培训投入的。

当b-c-e0时,该博弈成立并可能会出现两种均衡:如果此时员工选择留下所获得的收益d+e大于其选择跳槽时所获的收益a时,理性的员工必定会留在原来的企业,企业也必然会选择培训投入,这也是这个博弈中双方的最优决策;如果此时员工选择留下所获得的收益d+e小于其选择跳槽时所获的收益a时,理性的员工必定选择跳槽,此时企业损失为c,损失最惨重。对企业而言,如果知道这样做令员工跳槽的话,那么企业还不如刚开始就不培训,那样蒙受的损失会少些。这里需要指出的是,一个员工是否跳槽并不简单的取决于对方企业开出的薪酬。影响因素有很多,比如员工个性是否与企业匹配、员工个人发展前景、员工兴趣与岗位的匹配等等。上述表格中,企业如果不对员工进行培训,那么员工留下或离职取决于现有收入d和跳槽企业的薪酬a。

如果da,员工留下:反之员工跳槽

总之,员工是否留任企业,是一种利益的博弈,并且企业与员工之间存在着信息的不对称,企业必须采取先发行动传递信号减弱员工离任的动机,只要企业能留住员工,人力资本投资就会给企业带来巨大的经济效益。

[编辑]案例二:博弈论在企业经营活动的应用策略[2]

哈佛商学院波特教授的竞争五种力量,给出了我们思考行业市场竞争状况和态势时一种全面而详细的分析方法,其中一种力量是潜在进入者的威胁。

那么,根据市场类型(完全竞争市场、垄断竞争市场、完全垄断市场和寡头垄断市场),由于多数行业市场属于垄断竞争市场,就存在现有企业和新进入者之间的进入和退出博弈,这取决于彼此结构性的进入障碍、对关键资源的控制度、规模经济效应及现有企业的市场优势的因素。

如果你是现有行业的垄断者和一定程度的影响者,阻止潜在进入者进入市场或遏止现有企业恶性竞争的博弈策略有:

1.扩大生产能力策略

垄断者为阻止潜在进入者进入市场,垄断者可能对潜在进入者进行威胁。但垄断者的这种威胁是否能达到阻止进入的目的,取决于其承诺。所谓承诺(Promise),是指对局者所采取的某种行动,这种行动使其威胁成为一种令人可信的威胁。那么,一种威胁在什么条件下会变得令人可信呢?一般是,只有当对局者在不实行这种威胁会遭受更大损失的时候,与承诺行动相比,空头威胁无法有效阻止市场进入的主要原因是,它是不需要任何成本的。发表声明是容易的,仅仅宣称将要做什么或者标榜自己是说一不二的人也都缺乏实质性的意义。因此,只有当对局者采取了某种行动,而且这种行动需要较高的成本或代价,才会使威胁变得可信。

2.保证最低价格条款的策略

所谓“保证最低价格”条款策略,即可采取限制性定价策略,通过收取低于进入发生时的价格来防范进入。如某商店规定,顾客在本商店购买这种商品一定时期内(如一个月),如果其他任何商店以更低的价格出售同样的商品,本店将退还差价,并补偿差额的一定百分比(如10%

)。例如,如果你在该商店花5

000元购买了一架尼康相机,一周后你在另一家商店发现那里只卖4500元,那么你就可以向该商店交涉,并获得550元的退款。

又如假定一个将存在两期的市场。在第1期只有一个厂商,面临两种选择:

①制定一个垄断高价60元,可获1

000元的利润,但会使潜在企业认为该行业有利可图,从而选择在第2期进入;而一旦该市场有两个企业存在,将会使市场价格下降到30元,企业利润降为200元。这样,两期的总利润是1000+200=1200元。

②制定低价40元,潜在企业如果进来,价格降到20元,两个企业的利润都将是0。

故此时潜在企业将不会进入。这样,第二期的价格可以确定一个垄断高价60元,因此总利润将为600+1000=1600元。

对消费者来说,保证最低价格条款使你至少在一个月内不会因为商品降价而后悔你的购买,但这种条款对消费者是承诺,对竞争者是警告,无疑是企业之间竞争的一种手段。

保证最低价格条款是一种承诺,由于法律的限制,商店在向消费者公布了这一条款之后是不能不实行的,因此它是绝对可信的。这一承诺隐含着企业A向企业B发出的不要降价竞争的威胁,并使这种威胁产生其预期的效果。

3.限制进入定价策略

限制进入定价是指现有企业通过收取低于进入发生的价格的策略来防范进入,潜在进入者看到这一低价后,推测出进入后价格也会那么低甚至更低,因而进入该市场终将无利可图而放弃进入。

4.掠夺性定价策略

掠夺性定价是指将价格设定为低于成本来达到驱逐其他企业的目的,而期望由此发生的损失在新进入企业或者竞争对手被逐出市场后,掠夺企业能够行使市场权力时可能得到补偿,即在驱逐其他企业后,再制定垄断高价以弥补前期的损失。这也是一种价格报复策略。掠夺性定价与限制定价之间的差异在于限制定价是针对那些尚未进入市场的企业,是想较长一段时间内维持低价来限制新企业的进入,而掠夺性定价则将矛头指向已经进入的企业或即将来临之际。如你产能过剩,在新企业进入时可以进行产能扩张,将商品大幅降价防堵其进入。

5.广告战博弈

有些商品只有在使用后才知道其质量真正如何,我们把这种商品称为经验品。只有生产那些高质量经验品的企业才会选择做巨额广告,而低质量的企业将不会做广告。原因是高质量经验品会有大量的回头客,而低质量经验品则鲜有人再次光顾。

另外现有厂商之间产量、价格竞争的博弈,尚有古诺模型、伯川德模型可以描述。博弈理论在宏微观层面对企业参与竞争、制定竞争策略均有指导意义。著名营销专家希顿曾说,企业家的艺术就是对企业的策略性经营和管理,博弈作为策略,企业在当今激烈的市场竞争中需要博弈!

博弈论(二):如何突破困境,实现共赢

博弈较量中不是“你输我赢”的结局,而是共同追求彼此的利益。如果只顾自己单方面的利益,最后导致的问题往往是两败俱伤。

博弈论聚焦合作策略,为日常生活中的矛盾纷争找出最优解。想在博弈中取胜,我们可以通过一些策略,帮助我们去争取自己的利益。

主要通过两种方式第一,达成合作协议,第二,让各方不变卦不作弊。具体方法如下:

1、公平分配 我切你选方法

对于公平的向往深植入我们的内心,是我们的动物本能,在面对资源有限的情况下,在和人性抗衡的过程中,想要公平分配“我切你选”能化解这个难题。总结来说,是指一方提出方案,另一方来选择。当然,这个方案必须基于两个方案都是均衡的条件。一方拥有分配权,而另一方享受优先选择权,彼此为了保证自己的利益尽量少受损失,会在分配时就尽量的均衡。

这种方法也叫大中取小原则,就是说在一段博弈中你需要先衡量局势,考虑各种不同的选择造成的最大损失或最坏结果是什么,然后再决定如何让损失最小化。发展中国家和发达国家发生公海海域纠纷,联合国就用这种“你切我选”的办法,确保尽量公平。比如遗产分割,离婚冲突,这种情况下用这种方法能在一定程度上减少损失,如果持久战则会消耗和损失更多。

2、有争议的部分平分法

过去一些一夫多妻的部落,丈夫死后,大老婆坚持说自己应该拥有丈夫的全部财产,小老婆说自己拥有一半财产,结果部落长老的判决法为75:25,遵循的原则就是“争议部分均分法”,就是先处理没有争议的部分,在处理有争议的一部分,所以争议的部分是小老婆说自己应该拥有一般财产,按平均下来是25:25,再加上原来没有争议的部分,结果就是75:25。

3、调整赢家法

基本原理就在于对于同一项资产,不同的人可能会定出不同的价值,假如双方要划分所有权,就可以动些手脚,让双方感觉自己都拿到超过一半的所有权,达到双赢的局面。而且不管是什么情境都能够适用,这个叫调整赢家法,双赢。生活中房屋中介卖房常常使用的方法,互相调节,买方会觉得自己买到了便宜的房子,卖主会觉得自己卖的值。

4、石头剪刀布的应用

如果双方无法达成共识,那就交给命运吧,用猜拳来决定。博弈双方同意以随机方式来解决问题,猜拳不败重点就在于:找出一个另对方无法预测的随机出拳策略,就是不要让对方看出你出拳的套路,这个看似简单的方法却非常实用和广泛应用,虽然简单却有很深奥的规律。

日本一家公司要拍卖所收藏的所有印象派画作,有两家拍卖行同时竞拍,日本公司也不知道把生意交给谁好,便发电子邮件让两家拍卖行自己解决,并使用剪刀石头布方法。生活中常用的足球比赛,开场时裁判用抛硬币方式来决定哪方先开球。用这样的方法在博弈中胜败几乎都是随机的,所以很容易被接受。

5、用沟通协商建立联盟

博弈中常见的解决方式是威胁和奖励,比如在职场中,领导对于下属所采用的管理方式常用的就是威胁和奖励,再比如在父母与孩子的博弈较量中,也是威胁和奖励,或者强制手段去赢得最终胜利。

沟通是解决问题是本质,而不是靠威胁和奖励,最有效的是通过沟通和对方建立联盟,达成合作方案,那遇到的问题基本都能够得到解决。联盟建立的关键是信任,一旦有了信任,联盟很容易建立。如果能够形成联盟,最终会达成的解决方案就叫作帕累托最优。大家就都能够沿着这个方式,沿着一套规矩去做,当然如果外部的条件在发生改变、在引入新的博弈方,格局就会发生改变。

6、建立有效的信任机制 

我们天生就很难信任他人,因为不信任更接近于我们原始的本性。原始社会,到处都是危险,但如果一个人完全跟别人不合作,也没法生存下去。信任是原始人类后天发展出来的东西,这个底层逻辑就是不信任是风险导向策略,信任是报酬导向策略。

信任是一种能力,我们要变得明智,并不是放弃相信他人,而是多去了解被骗的案例和套路。我们被骗的成本有限的,因为可以认清一个人一件事,以后避开,但如果一招被蛇咬十年怕井绳因此不信任任何人,那就会失去很多机会,那付出是成本是一辈子的。现在这个年代,很多时候都是需要团队协作,需要各种各样的合作,而非单打独斗,毕竟每个人的能力、时间、精力有限,如果对他人都不信任,则无法达成合作,导致无法在社会上生存。

不管是在生活中还是社会博弈中,如果双方选择信任,就能克服困境。但让彼此信任,并不是一件容易的事情。这样的情况下,我们可以使用一些增强信任的策略来增强合作的信任感,关于增强信任感的4招:

第一招可信的承诺: 在生活中,父母为鼓励孩子达成合作,惯用假定条件给予奖励。比如,假如你成绩考到前三名,我将带你去看海;假如你每天按时运动,我将给多给你50块钱的零花钱等等。可信的承诺前提是“有效”,比如“去看海”和“多给50元零花钱”实现起来比较容易,但是假如给孩子承诺“把天上的星星摘下来”就超出了可实现的范畴,最终失去了鼓励合作的效用。

第二招直接信任: 直接信任对方,正所谓,大度能容,让对方看到我们的合作态度和开放的胸怀,这样要更容易面对合作中的阻碍,如果保持“你不合作,我也不合作”的态度,并不利于我们在一场博弈中取得预期利益。

第三招潜在的信任培养: 潜在信任需要通过共同的经历或者事实支撑建立起来。生活中,直接信任的发生概率往往低于潜在信任,所以我们要有意识地培养潜在意识,为自己赢得资源和支持,培养潜在的信任在于“慷慨大方和利他主义”,当我们报以真诚之心和利他思维,最后也将获得他人的信任而成就自己。

第四招仪式的力量 :为了取得对方的信任,可以将彼此的约定以及限制自己选择的一些条约或要求等等,通过某种仪式的方式“昭告天下”。古时出征的沙场点兵,除了鼓舞士气,从另一个层面上来说也是一种建立信任的仪式。帝王通过点兵仪式传递决心和支持,将领们立军令状将他们的决心传递给所有的人。

个人在博弈中扭转全局的十大要诀 

1.赢则守,输就变。不主动做坏人,也不事事心机,但是人不犯我我不犯人,人若犯我我必犯人。

2.带入新的参与者。引入另外一方进来,这样博弈的局面就会改变,三方在一起博弈就能够互相制衡了。在这样的局面中要学会退出来让两者先博弈,自己成为那个受益者,“螳螂捕蝉,黄雀在后”就是这个道理。

3.建立互惠形式。相信博弈不是一次性的,给自己留一条后路。

4.限制你自己的未来选项,让自己一旦背叛合作,就会受损失。类似破釜沉舟的方法。

5.付出你的信任。建立信任别人的声誉,让别人知道说你有包容度,而且你很重视自己的承诺。

6.定下特殊条件,双方如果想单方面背叛,就会承受损失。双方如果想单方面背叛就会承受损失,像现在签的很多对赌协议,就是这样的方式。

7.使用补偿给付,来建立并维持合作的联盟。补偿的可以是金钱、情感、尊重等,如果能够找到更多的效用,就能够引入更多谈判筹码。

8.注意七大困境(具体内容在    博弈论(一):生活无处不博弈 ),考量各参与者的利益与成本,让困境不复存在。

9.分摊各种责任、工作、惩罚等,让人人都觉得结果公平。

10.将团队化整为零。人太多,博弈方过多,博弈变得很复杂,很难摆得平。如果把它们变成一个一个的小团队,在小团队之间达成共识可能比较容易产生更高的效率。

天下熙熙攘攘,皆为利来利往,我们个体想要在错综复杂的相互影响中取得最优策略,必须要懂得一点博弈论。博弈论很好地给我们提供了一种解决问题的思维方式,博弈论的观点告诉我们,面对利益的相互制约,最佳的应对策略不是冲突,而是合作,不是竞争,而是互助。

有关博弈论的英文书籍

第一本、Agreeing to Cooperate: Cooperative Game Theory and Solution Concepts

CONTENTS

1. Cooperative Game Theory

2. Coalitional Games with Transferable Payoffs

3. Payoff Profiles and the Core

4. Example: Treasure Hunting

5. Application: Intra-Firm Bargaining

6. The Core of the Firm

7. A Production Example

8. Marginal Contributions and the Shapley Value

9. Expected Marginal Contributions

10. Application: The Shapley Value and a Worker

11. The Shapley Value for a Worker: The Easy Way

12. Application: The Shapley Value and the Firm

13. The Shapley Value for a Firm: The Easy Way

14. Justifying the Shapley Value

15. Behaviour and Scope of the Firm

16. The Over-Hiring of Labour

17. Investment Incentives and Frontload Factors

18. Economies of Scope and the Effect of Synergies

第二本、Springer07《合作博弈导论》(Introduction to the Theory of Cooperative Games 2nd ed)

Introduction to the Theory of Cooperative Games (Theory and Decision Library C) (Hardcover)

by Bezalel Peleg (Author), Peter Sudhölter (Author)

Hardcover: 328 pages

Publisher: Springer; 2nd ed. edition (October 3, 2007)

Language: English

Book Description

This book systematically presents the main solutions of cooperative games: the core, bargaining set, kernel, nucleolus, and the Shapley value of TU games, and the core, the Shapley value, and the ordinal bargaining set of NTU games. To each solution the authors devote a separate chapter wherein they study its properties in full detail. Moreover, important variants are defined or even intensively analyzed. The authors also investigate in separate chapters continuity, dynamics, and geometric properties of solutions of TU games. The study culminates in uniform and coherent axiomatizations of all the foregoing solutions (excluding the bargaining set). Such axiomatizations have not appeared in any book. Moreover, the book contains a detailed analysis of the main results on cooperative games without side payments. Such analysis is very limited or non-existent in other books on game theory.

第三本、Models in Cooperative Game Theory (Springer 2008)

Springer 2008

Models in Cooperative Game Theory (Hardcover)

by Rodica Branzei (Author), Dinko Dimitrov (Author), Stef Tijs (Author)

Publisher: Springer; 2nd ed. edition (April 1, 2008)

Language: English

第四本、《动态合作――尖端博弈论》

作者: 杨荣基

副标题: 尖端博弈论--较诺奖贡献更复杂的解法与数式

ISBN: 9787509201275

页数: 269

出版社: 中国市场出版社

定价: 40.0

装帧: 平装

出版年: 2007-2-1

两位在世界上处领导地位的专家及博弈论先驱—杨荣基教授及彼得罗相教授-合著的《随机微分合作博弈》一书,将会首次为『随机合作』提供基础及实体的解法。在这个极其艰深的课题中,两位作者用他们的研究理念创出崭新及精确的处理方法。此书将成为这方面研究的划时代经典著作。 ----数学大师,美国加州伯克利大学利智文教授(George Leitman)

这本由一位世界最出色的动态博弈论家与一位世界顶尖的“随机微分合作对策”学家合作的巨著,将成为经典之作。他们为精确计算“得偿分配程序”所创的数学定理,是“随机微分合作对策”理论的一项突破。此书在“动态平稳”研究的发展--特别是“子博弈一致”--实在是李亚普诺夫、蓬特里亚金及祖博夫等在这方面的杰出传统的延续。 --俄罗斯科学院应用数学研究院院长马扎洛夫教授(Vladimir Mazalov)

“较诺奖贡献更复杂的解法和数式”

摘要: 尖端博弈论--较诺奖贡献更复杂的解法与数式 / 杨荣基 / 中国市场出版社

简介 · · · · · ·

博弈不但串联起人生的每个环节,也串联起整个人类和世界。博弈论的发展已经令经济学起了翻天覆地的变化,时至今日它已经成为经济分析的标准工具。

在博弈论的研究和应用范畴中,动态微分博弈论是最艰深而成果极大的分支,它研究的是随时间而转变的决策互动,动态博弈的困难在于,在前一刻最优的决策在下一刻可能不再为最优,因此在求解上发生很大的困难。

合作是经济研究中的另一个重要主题,成功的合作往往能通过协同效应,发挥各方的所长与优势,共同创造共赢的局面,甚至实现帕累托最优。但是,由于参与博弈的各方利益间存在着冲突,搭便车的问题可能导致合作受到破坏。而动态的环境下,合作将变得尤其困难。然而现实的环境充满动态合作情况,世界贸易谈判、境内境外投资、跨国污染控制、地方合作等等都是这样的例子。此外,由于在时间的的流动中还包含着随机发展的变化,令动态博弈的的复杂性大为增加,这种复杂的决策情况称国随机动态微分合作。在这些情况下,合作问题求解所涉及的数学理论和技术较诺奖贡献更为复杂。可以说,如何解决随机动态环境下的合作问题是博弈论应用和发展的一个重大课题。

本书作者杨荣基和皮得罗相教授是世界知名的博弈论学者,他们近年来所发表的一系论文得到国际博弈论界的高度评价,在随机微分合作领域取得了一系列带有划时代意义的理论突破,这些理论突破为上述问题的解决奠定了基础并指明了进一步研究的方向。

本书是对这一重大理论成就的简明阐述,作者首先以浅白的文字介绍了静态博弈的基本概念以及非动态环境下博弈论的局限,接下来运用新发展起来的理论工具分析了如何在随机动动态的环境下成功合作。本书代表着当前国际博弈论研究的最前沿,对于有志于从博弈论的普及水平进一步提高的学习者和研究者来说,这是一部难得的参考读物。

作者简介 · · · · · ·

杨荣基,现为香港浸会大学对策研究中心主任及博弈论讲座教授、圣彼得堡大学对策研究中心主任康托罗维奇研究讲座教授。杨教授是约克大学经济学博士,在圣彼得堡大学攻读应用数学博士DSc,并获颁该校最高博士学位Dr.h.c。

2002年,杨教授和彼得罗相教授与诺贝尔奖得主纳什、泽尔滕及奥曼等共同获得青岛大学荣誉教授称号。杨教授是《国际对策学报》总编辑及国际动态对策学会中国分会的创会顾问,他在动态博弈论研究领域有多项始创贡献。他与彼得罗相合著的全球首本《随机微分合作博弈》被誉为延续了李亚普诺夫、蓬特里亚金及祖博夫等在这方面杰出传统的划时代经典著作。

第五本、《合作博弈论:解与成本分摊》

中国市场出版社,2008年4月 书号:978-7-5092-0279-1 定价:40元

作者:董保民 对外经济贸易大学经济学系王运通 加拿大温莎大学经济学系郭桂霞 北京大学中国经济研究中心

本书是研究生层次的合作博弈论教材,以作者在对外经贸大学和加拿大温莎大学的讲义为基础。全书包括合作博弈基本内容的介绍和对于理论应用的较为深入的介绍,特别是反映了费用分摊理论以及合作博弈在网络经济学方面的

感谢采纳!

关于博弈分摊和博弈和博弈的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。

本文转载自互联网,如有侵权,联系删除