纳什均衡是什么?

2024-04-28

1. 纳什均衡是什么?


纳什均衡是什么?

2. 细说纳什均衡?

   约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的 最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。   纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。 编辑本段标准定义  纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1, si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1, sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。         纳什均衡经典案例:囚徒困境  1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。   假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。   囚徒困境博弈    A╲B坦白抵赖坦白-8,-80,-10抵赖-10,0-1,-1  关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。

3. 关于纳什均衡的

经济学最常用的价值标准时看该均衡是否实现了资源的最优配置,而资源的最优配置的标准是帕累托最优的这一种状态,,社会改革,如政治制度的建设的技巧之一就是将非帕累托最优转化为帕累托最优,只有这样,一种制度安排要发生效力,才会降低了阻力,才能成立。

附:帕累托改进指重新调整资源的配置可以在不损害他人利益的前提下增加某个人的利益。

关于纳什均衡的

4. 纳什均衡是什么


5. 纳什均衡是啥?


纳什均衡是啥?

6. 纳什均衡是什么?


7. 纳什均衡是什么?

如何来解释纳什均衡呢?假定在某一对策中,如果每一局中人都熟知他的对手们所选择的策略,局中人关于对策可能达成一致;但如果局中人倾向于选择一种不一致的策略,则就不会有人考虑这种一致而自我强迫服从这种策略。因此,从这个意义上来讲,自我强迫协议是组成一个纳什均衡的必要条件。但是,并不是每一个纳什均衡都是一个自我强迫协议。

纳什均衡是什么?

8. 纳什均衡的介绍

纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。