一个博弈论问题

2024-04-29

1. 一个博弈论问题

参与人i的策略空间为 Si=[0,+∞) 
参与人i的支付函数:设si为参与人i的策略,s-i为其他参与人的策略.m为其他参与人策略之和.a为总金额.且设有n个参与人.
则: 
Ui(si,s-i)= si 当si+m ≤ a
0 当si+m> a
纳什均衡、
由题设可知,该博弈为对称博弈.
因此NE策略组合s={s*,s*,s*...一共n个...} 
再由支付函数可知当s*=a/n时,参与人的收益最大化.s为该博弈的纳什均衡.
实际上,这并不是该博弈的唯一一个纳什均衡.
该博弈的纳什均衡有无数个.设参与人1,2,3,4...n的策略为s1,s2,s3,s4...sn.
实际上任何满足 s1+s2+s3+s4+s5+...+sn=a的策略组合都是该博弈的纳什均衡.
因为当 s1+s2+s3+s4+s5+...+sn=a时,任何一个参与人单方面改动策略(无论增大或者减小).他的收益都不会增加,反而会减小.

一个博弈论问题

2. 博弈论的问题

很高心为你回答这个问题。
理性的选择往往都会导致次优的结果,单并不是绝对的,这是非合作博弈的一个结论,他是在人理性思考最求个人利益最大化下某些情况中存在的。举例来说,在囚徒困境(不懂可以百度这个词条)当中,每个人的最优选择都是背叛,因为策略不背叛是每一个参与人的严格劣势策略,这样就导致了,2个囚犯都会选择背叛从而他们都要坐8年牢,这个结果的确是2个人的理性选择,但是却劣与2个人同时选择不背叛(抵赖)只做一年牢。

如果你还没看懂,我再举一个例子,比如A和B这2家公司打价格战,A公司选择降价促销,从而抢占原本属于B的市场份额,B发现了立刻降价从而抢回自己的顾客,如此,A和B两家公司的售价将在成本上一点徘徊,消费者获利,2家公司都要亏损,等等。很多例子都能够证明理性的选择导致了次优的结果,
博弈论的学习其实有一部分原因就是能够想办法改变这个结果,让理性朝着最优的方向发展。

3. 几个博弈论的问题

我对博弈论的概念不是很熟,如果说的不对请指正。
第3题应该是“没有,有”,B选择L是占优策略,无论A选择什么,B选择L都能获得最大收益,而A没有占优策略,任意一个策略都只有在B的特定策略下最优。
第7题的纯策略纳什均衡我不是很理解,我就按我的理解说说,我觉得(U, L)应该是一个纯策略纳什均衡,因为这种情况下大家都收益最大,没有人会改变策略。所以第7题可能是选第2和4的选项。

几个博弈论的问题

4. 博弈论问题?

第二个把第一个打死,其他人保持不动
首要目标是保证自己活下去,自己不开枪的话就能保证自己不会死。第二个可以不开枪,但是杀死敌人之后他也并不会死,所以按照题意,他会开枪。至于第三个人为什么不开枪
第二人开枪,选择权就交给了第三人。他看到第一人开枪之后被第二人射杀,如果他自己也开枪,那么他就处于原来第二人一样的位置,必然会被后面的人杀死,不符合保命的首要目标,所以他并不会开枪。
第二人决定权完全在于自己,可以通过把握心里,同时完成两个目标

5. 博弈论相关问题

嫌疑人可以选择,缴税,偷税,税务局可以选择,查,不查,建立支付矩阵
           查       不查
缴税  -1,-c     -1,0
偷税  -f,-c       4,-4
混合博弈均衡可以假设p,q然后列出反应方程,然后画出交点即可求出

博弈论相关问题

6. 博弈问题

例 1.桌子上有 24 根火柴,甲、乙两人轮流取,每人每次取 1---3 根。谁取到最后一根谁就 获胜。甲该怎样取才能保证获胜?
练习 乙两人轮流报数,报出的数只能是 1 至 7 的自然数,同时把所报数一一累加起来,谁先 使这个累加和达到 80,谁就获胜。问怎样才能确保获胜?
两人轮流报数,每次报一个数,但报出的数只能是 1 至 8 的自然数,同时把所报数一一 累加起来,谁先使这个累计和达到 80,谁就胜。问怎样才能确保获胜?
例 1.解析:甲要获胜,就要拿到第 24 根火柴;要想拿到第 24 根火柴,必须先拿到第 20 根; 要想拿到第 20 根,必须先拿到第 16 根,同理可推出,甲必须先拿到第 12、8、4 根,甲才 获胜。所以,解决办法是,①让乙先拿,②甲后拿的根数=(1+3)-乙取的根数。
有意思的是:24÷(1+3)正好没有余数。
思考:如果桌子上有 25 根或 26 根火柴,甲要获胜又该如何? 归纳:经过上面两题思考分析,我们发现:①取的先后次序是由总数除以取的规则中最 : 少和最多数的和所得到的余数来决定:余数是 0,获胜方要让对方先取;余数不是 0,获胜 少和最多数的和所得到的余数来决定: ,获胜方要让对方先取; , 方要先取② 方要先取②获胜方每次取的数量和对方取的数量之和应该是取的规则中最少与最多数之 和。 练习答案 分析与解答: 分析与解答:我们可以采用倒推法来思考。 因为每次报 1 至 7 的自然数,所以要想报到 80,应抢先报数使累加和为 72,给对方留 下 8 个数。 同样道理,要使累加和抢先到 72,应抢先报数使累加和为 64;依此类推,每次都应抢 报数,使累加和为:80,72,64,56,48,40,32,24,16,8。 所以获胜的方法是: (1) 让对方先报; (2)对方报 a( 1 ≤ a ≤ 7 ) ,你就报 8 − a ,必胜。 因为每次报 1 至 8 的自然数,所以要抢到 80,必须抢到 80-9=71,给对方留下 9 个数。 同样的道理,要使累加和抢到 71,就必须抢到 71-9=62. 依次类推,就应该抢到 53,44,35,26,17,8 (1)所以自己先报;总给对方留下的总是从(9+1)的倍数那个数开始;(2)对方报 对方报 a( 1 ≤ a ≤ 7 ) ,你就报 9- a,必胜。

7. 关于博弈论的问题,帮解答下啊

案例-囚徒困境
  在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。   囚徒困境博弈 [Prisoner's dilemma]  A╲B 坦白 抵赖 
坦白 -8,-8 0,-10 
抵赖 -10,0 -1,-1 
对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。你参照这个做吧

关于博弈论的问题,帮解答下啊

8. 博弈论概念问题

假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1]),则此策略组合被称为纳什均衡
纳什均衡
。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。
 
子博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。 
  对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。 
  博弈论专家常常使用“序惯理性”(Sequential rationality):指不论过去发生了什么,参与人应该在博弈的每个时点上最优化自己的策略。子博弈精练纳什均衡所要求的正是参与人应该是序惯理性的。对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。因为有限完美信息博弈的每一个决策结都开始一个子博弈。求解方法: 最后一个结点上的子博弈(纳什均衡)→倒数第二个(纳什均衡) → ······ → 初始结点上的子博弈(纳什均衡)。 
 
纳什均衡(Nash Equilibrium)和子博弈完美纳什均衡(Subgame perfect Nash equilibrium)所反映的博弈都包括了一个基本假设:即博弈的结构、博弈的规则、所有局中人的策略空间和支付函数(payoffs)都是共同知识(common knowledge)。满足这样一个假设的博弈称为“完全信息博弈”(games of complete information)。但在现实生活中这一假设往往得不到满足。在非合作博弈论中,局中人对博弈的结构以及其他局中人的特征并没有准确的知识的情况叫“不完全信息博弈”(games of incomplete information)。在1967年以前,博弈论专家对不完全信息博弈是束手无策的。 Harsanyi(1967—1968)的贡献解决了这个问题,填补了博弈论乃至经济学的一大空白,他也因此而获得了诺贝尔经济奖。John C.Harsanyi引入了一个虚拟的局中人——自然(nature)。与一般的局中人不同,“自然”没有自己的支付和目标函数,即所有结果对它而言是无差异的。自然首先行动,决定局中人的特征。被选择的局中人知道自己的真实特征,而其他局中人并不清楚这个被选择的局中人的真实特征,仅知道各种可能特征的概率分布。另外,被选择的局中人也知道其他局中人心目中的这个分布函数,也就是说,分布函数是一种共同知识(common knowledge)。John C.Harsanyi的这项工作被为“Harsanyi转移”(the Harsanyi transformation),通过这个转换,John C. Harsanyi把“不完全信息博弈”转换成“完全但不完善信息博弈”(complete but imperfect information)。这里“完全但不完美信息” 指的是,自然作出了它的选择,但其他局中人并不知道它人具体选择是什么,仅知道各种选择的概率分布。这样一来,不完全信息博弈就变得可以进行分析了。在这个基础上,John C.Harsanyi定义了贝叶斯纳什均衡(Bayesian-Nash equilibrium)。 
 
精炼贝叶斯均衡是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态均衡的贝叶斯(纳什)均衡的结合。有些书上或论文中也写成精炼贝叶斯纳什均衡。 
  具体来说,精炼贝叶斯均衡是所有参与人策略和信念的一种结合。它满足如下条件:第一,在给定每个参与人有关其他参与人类型的信念的条件下,该参与人的战略选择是最优的。第二,每个参与人关于其他参与人所属类型的信念,但是使用贝叶斯法则从所观察到的行为中获得的。 
  完美贝叶斯纳什均衡的要点是在于当事人要根本所观察到的他人的行为来修正自己的有关后者特征的“信念”(主观概率),并由此选择自己的行动。完美贝叶斯纳什均衡是所有局中人策略和信念的一种结合,它满足如下条件:(a)给定每个局中人关于其他局中人特征的概率分布的信息,他的策略选择应该在每一个子博弈都构成贝叶斯均衡,也就是说,给定每个人有关其他人特征的信息的情况下,他的策略等待是最优的;(b)每个人有关他人特征的信念都是使用贝叶斯法则从所观察到的行为中获得的。
最新文章
热门文章
推荐阅读