当前位置: 首页 > news >正文

专业学习|博弈论-博弈论概述

(一)认识博弈论:解析复杂决策与策略

(1)认识博弈

        博弈论广泛应用于分析个体间因利益冲突而产生的决策问题。通过构建不同模型来探讨如经贸关系、军事威胁等问题,旨在寻找均衡解并提供新知,相较于计量经济学方法更为困难。政策制定与个体响应构成典型的博弈问题,反映上层政策与下层对策间的动态互动。

        采用博弈建模是希望首先这个模型是可驾驭的,即一定是能够分析出均衡均衡解出来的。博弈模型你最后得到的结论要对人们有启发意义,你要贡献一些新的思想和知识。

(2)博弈论视角下的选课策略与决策

        奥德修斯的博弈策略、应对学习挑战:自我博弈与坚持策略

        通过探讨本科生和研究生在选课过程中采用的不同策略,展示了博弈论在实际应用中的复杂性。本科生的选课过程被视为一个典型的博弈问题,其中个体面临配置有限资源的选择。而研究生则更注重选课后的成绩对奖学金和个人发展的影响力,因此采取了以成绩为导向的策略,包括考虑课程的难度和班级平均成绩等因素。此外,还提到了个体内部的博弈现象,如冬季起床的困难,以及自我对抗的情况。这些例子说明,在不同情境下,博弈论能够帮助我们理解个体决策背后的逻辑,并揭示了制定有效策略的重要性。

(3)博弈推荐书籍

        推荐书籍《妙趣横生博弈论》

        《经济学中的最优化方法》,讲经济学中所用的各种各样的最优化的数学方法。

(二) 理解博弈论

(1)博弈论定义

        首先概述了博弈论的基本概念,强调其研究的是个体间因利益冲突而作出决策的问题,并指出博弈论广泛应用于国际关系、经济学等多个领域。他通过介绍博弈论的发展历程,包括双寡头模型、纳什均衡和演化稳定策略等关键概念,展示博弈论在分析人类决策过程方面的有效性。他进一步探讨了博弈论的实际应用,比如拍卖理论和企业战略,以及经济学家因此获得诺贝尔经济学奖的案例,以此来证明博弈论的重要性和影响力。最后,他强调博弈论的核心是分析理性行为选择与策略制定,认为理解和运用博弈论对于解决复杂问题至关重要,从而表明博弈论对于我们理解个体及群体交互行为的作用和价值。

(2)从博弈到博弈论:理性行为与策略选择

        博弈描述了多方利益交错冲突下的决策问题,博弈论则深入研究在这些情境中应如何做出决策。博弈论不仅仅局限于简单的游戏如围棋,其探讨的是更加广泛的问题,并假定参与者具有理性共识及完美记忆,通过逆向归纳法寻找最优策略。然而,现实生活中的参与者往往不具备这些理想条件,使得博弈论的应用更为复杂和引人入胜,能够为我们提供深刻的洞见和令人惊讶的结论。

        博弈论研究人们在相互制约的利益下做出的理性行为选择和相应策略,特别强调在策略互动中的互为最优反应的状态。其思维方式涉及深层次的换位思考,并利用数学工具进行模型构建和决策分析,旨在理解智能理性决策者间的冲突与合作模式。

(3)博弈论的历史与发展:从田忌赛马到现代应用

        博弈论的起源可追溯至19世纪,早期如库洛的双寡头产量竞争模型和Bertrand的双寡头价格竞争模型奠定了基础。1913年Zermelo对国际象棋的严格证明标志着博弈论的新进展。冯洛伊曼于1928年提出的最小最大定义是博弈论中第一个重要的定理,确立了均衡存在的必要条件及其构成方式。1944年冯洛伊曼与摩根斯坦合著的《博弈论与经济行为》被视为博弈论学科诞生的标志。随后,纳什均衡、双边谈判问题的最优解等概念的提出进一步丰富了博弈论的内容。此外,Hsrsanyi的贝叶斯均衡和克雷普斯与威尔士的续贯均衡概念也在博弈论的发展中占据了重要地位。自1994年以来,博弈论在理论与应用上都有显著发展,特别是在拍卖研究方面,近年来多位经济学家因博弈论或其应用获得诺贝尔奖,突显了博弈论在当前经济和社会决策中的重要性。

(三)博弈论与理性决策

        博弈论强调通过层层嵌套的换位思考进行决策,不同于日常生活中的单向思维。理性被定义为追求个人利益最大化的行为,但这种追求不应仅依据目标进行判断,因为价值观的不同导致目标各异。有效的博弈论分析应将参与者的既定目标视为合理,以此为基础探讨其最优策略及应对措施。效用函数作为分析工具,允许设定不同类型的自变量以反映各参与者的偏好和目标

(1)基本点“理性”- 理解认知理性与工具理性及其在博弈论中的应用

        理性通常通过参与者的决策能力和行为模式来定义,分为认知理性与工具理性。认知理性强调个体能基于所掌握的信息进行合理判断,并能利用贝叶斯法则修正信念。而工具理性则侧重于个体在形成信念后,能否选择最有利目标的行动。两者结合构成纳什均衡的基础,对于理解和评估博弈论模型至关重要。

(2)基本点“策略”-利益最大化与国际政治策略

        在大多数情况下,参与者追求的是利益最大化,无论是经济利益还是其他形式的利益。国际政治中的国家间博弈常常围绕权利而非纯粹的经济利益展开。随着力量对比的变化,国与国之间合作的重点也会随之调整。博弈论提供了一种分析参与者在不同情境下的决策过程和利益追求的方式,包括零和博弈的情形,其中一方的利益增加必然导致另一方的利益减少,使得双方无法通过谈判达成共同利益。

(3)一个中心“均衡”-博弈论中的均衡概念及其应用

        均衡是博弈论中的核心概念,最初由纳什均衡引入,指的是所有参与者策略互为最优反应的状态。然而,在实际应用中,单一的纳什均衡往往不足以解释复杂的博弈情况,因此发展出更多精巧的均衡概念以进行比较和选择。此外,算法博弈论的研究重点在于设计高效算法,解决特定博弈问题的均衡解,尤其在面对大量参与者或策略时,计算所有均衡变得异常困难。

(4)案例-田忌赛马与博弈论:策略与时机的选择

        本次讨论重点在于田忌赛马的故事及其反映出的博弈论思想,强调了在不同时间和情境下选择最优策略的重要性。同时,通过比较和分析历史故事与现实生活中的博弈情况,进一步阐释了博弈论的核心概念和应用。此外,还提到了博弈论在经济学等领域的重要性和实用性,并简要介绍了博弈论课程的目的和内容框架,旨在帮助学生理解博弈论的基本原理及其在实际问题中的应用。

(四)效用理论

        效用理论是决策论和博弈论的基础,帮助个体在面对不确定性时作出选择。通过为每个结果赋予一个数字(效用值),即便某些偏好难以量化,也能进行比较。冯罗与摩克斯坦为其提供了数学基础,引入期望效用的概念来比较不同概率分布下的结果偏好。效用理论的核心条件包括完备性和传递性,确保了偏好的一致性和合理性。在博弈论中,组织偏好需反映成员集体偏好,但集体偏好可能不满足传递性,需谨慎处理投票等形成的组织偏好

        风险与不确定性是决策中的基本概念,区别在于结果发生概率的可确定性。效用函数用于衡量个人对不同结果的偏好程度,分为风险中性、风险规避和风险偏好三种类型,解释了人们如何在面对不确定性时作出选择。冯诺伊曼期望效用定理指出,在一定条件下,可以通过比较期望效用值来反映参与者对不同选项的偏好。效用函数的应用及其对决策的影响是本讨论的核心,涵盖了效用理论的多个方面,如效用函数的条件、效用理论在决策过程中的应用及对风险的态度等。

(1)效用理论及其在决策与博弈中的应用

        效用理论为决策论和博弈论提供了基础,帮助个体或参与者在面对多种可能结果且结果具有不确定性时做出选择。该理论通过赋予每个结果一个数字(效用值)来衡量其偏好,即使某些偏好难以量化。冯罗与摩克斯坦首次为效用理论提供了数学基础,提出了使用期望效用来比较不同概率分布下的结果偏好。效用理论的关键条件包括完备性和传递性,保证了个体偏好的有序性和合理性。

1)序数偏好

        经济学中讲的是序数偏好,就是说你只是对不同的结果之间能够给出好坏的顺序。同时我们还要求因为你的行动产生的结果有可能是面临着不确定性的,有可能是有不同的概率得到不同的结果。

        关于个体偏好的第一个要求是完备性。要求对于结果集合中的任何两个结果,参与者应当能够分辨出他更偏好了一个,弱偏好。第二个要求的是传递性。传递性是说如果参与者我们用严格偏好,如果参与者严格偏好A胜于B同时又严格偏好B胜于C,那么则A胜于C,这是传递性。

        在博弈论中,组织被视为单一参与者时,其偏好应反映成员集体偏好,但集体偏好可能不满足传递性。通过投票等方式形成组织偏好时,需注意传递性问题以及策略性投票可能导致的结果操纵。此外,建立期望效应理论旨在处理决策结果的不确定性,涵盖多种不确定类型。

(2) 理解风险与不确定性:客观未知与主观未知差异

        风险与不确定性是两个基本概念,它们的区别在于结果发生的概率是否可以客观确定。风险(客观未知)通常指虽然结果未知,但不同结果发生的概率是客观存在的,例如赌博中的输赢概率。不确定性(主观未知)则进一步分为外生的不确定性(由外部环境因素引起,如不可预测的天气事件)和内生的不确定性(由参与者的互动行为导致的结果不确定性,类似于博弈论中的情形)。解决内生不确定性问题通常需要通过建立方程组来求解均衡,强调了参与者之间策略的相互关联性。

(3)案例-效用理论与决策选择

        讨论了效用理论中关于决策选择时如何处理完备性和传递性的问题。通过举例说明,在面临难以直接比较的选项时,通过对结果集合的限制和调整,可以使决策过程更加合理和有序。此外,还探讨了人们在面对风险和不确定性时的心理倾向,以及如何影响其决策选择。

1)框架效应影响选举决策:经济政策与国际比较

        两位经济学家就两位候选人提出的经济政策进行了效果分析,并将预测结果与另一国家进行对比。实验显示,选民的决策受到所选政策预期收益与该政策可能带来的国家间相对经济状况变动的影响。第一次实验时,许多人选择了一位被认为能带来稳定但可能低于其他国家增长的候选人;

        而在第二次实验中,考虑到另一位候选人的政策可能导致国家经济状况下滑至另一个国家之下,许多选民转而支持第一位候选人,展示了框架效应’如何影响选举决策。

(4) 效用函数的分成类型

        介绍了效用函数的概念和分类。效用函数用于衡量个体对不同结果的偏好程度,通过对结果集合中的每个结果分配一个数字来实现,从而能够比较出不同结果之间的相对好坏。效用函数主要分为三类:风险中性的、风险规避的和风险偏好的。其中,风险中性的效用函数表现为一条直线,表示同等权重对待不同收益;风险规避的效用函数表现出对中间状态的偏好高于极端状态,即更愿意避免风险;而风险偏好的效用函数则显示个体倾向于承担更多风险以追求更高的预期收益。通过实际例子如赌博和购买彩票,强调了风险偏好人群的存在及其在决策过程中的作用。

1)期望效用与风险偏好

        讨论了一个满足特定条件下的效用函数,强调了期望值在刻画参与者对不同概率分布结果的偏好中的作用。提出了六个条件:完备性、传递性、简化抽查、无差异抽取、抽签完备性和传递性以及确定事件准则,这些条件保证了效用函数的存在和有效性。特别提到了购买保险的行为体现了风险规避的倾向,与一般的风险偏好理论相悖,引发了对于效用函数应用范围和解释的深入思考。

2)冯诺伊曼期望效用定理及其应用

        冯诺伊曼期望效用定理表明,当满足上述条件时,存在一个数值集合与结果集合相联系,可将每种结果赋予一个数值,形成一个函数来衡量参与者的期望效用。通过比较不同抽奖方式下的期望效用值,可以反映出参与者对这些抽奖的偏好。此外,效用函数具有可缩放性,仅能描述同一参与者对不同结果的相对偏好,而无法准确衡量效用的实际大小或差异。

        期望效用理论强调,在决策过程中只需关注期望效用的高低,不必过分考虑风险因素。

按照期望效用理论,期望效用已经把对风险的考虑包含在内了。效用的方差是毫无意义的。期望效用已经把收益跟风险全部综合考虑了。所以只需要的话比较期望效用的高低啊不要再考虑什么方差。既然这两个选择的效应一样,那么你就应当认为这两个选择是有差异的。

(五)博弈论的扩展性表述

        本课程着重介绍了博弈的扩展型表述方法,强调了清晰定义博弈问题的五要素:参与者、行动顺序、可选动作、已知信息和得益分配的重要性。

        介绍了博弈的两种主要表述方法:扩展型表述和策略性表述,而扩展型表述是基础中的基础,需要明确定义博弈的参与者、行动顺序、信息掌握情况以及所有可能的行动组合对应的收益或效用。在非合作博弈中,所有参与者追求期望效用最大化,遵循冯·诺依曼期望效用定理。使用博弈树有助于表示和分析参与者数量有限或行动选择可数的博弈情况。

        博弈论模型构建须基于明确的问题定义,无论采用何种表述方式。课程还涵盖了博弈中的不确定性处理,如引入机会节点来表现外生与内生不确定性,以及信息集概念在不完全信息博弈中的应用。通过具体案例,如简单的诉讼博弈和复杂的华为CFO孟晚舟事件的博弈模型,他展示了如何使用博弈树等工具来详细描述博弈过程,并且强调了信息集在策略选择中的关键作用。最后,他提出判断一个博弈树是否符合完美回忆的原则,并通过实例进行了解释。

(1) 博弈论的五大要素及博弈的扩展型表述

1)博弈论的五大要素

        本节课介绍了博弈的扩展型表述方法,强调了以博弈论的形式清晰表述博弈问题的重要性。通过五个关键要素:参与者、行动顺序、可选策略、(对手)已知信息和得益(效用)分配,完整定义了一个博弈。对于一些不特别复杂的博弈,可以采用博弈树的形式来表述,它是属于扩展性表述中的一种比较直观的方式。

2)案例-讲解简单的博弈树

        在非合作博弈问题中,假设所有参与者追求期望效用最大化,且遵循冯·诺依曼期望效用定理。此外,文中还提到了使用博弈树来表示博弈情况,尤其是在参与者数量有限或行动选择可数时。最后,强调了无论是何种表述方式,明确地定义博弈问题是进行后续分析的前提。

        信息补充完全之后的博弈树:

        我们在这样一个简单的诉讼博弈中,只有两个参与者。我们把这一个节点就是原告率先行动的这个节点,称之为博弈的博弈树的根节点,就是说它是树的始发的节点,称之为根节点,然后把每一个就是代表着博弈结束之后的一种特定状态的这个节点,我们称之为博弈的终节点,就终止的节点。在这个图上,我是把终结点用实心的语言来标识的。

        特别提到了引入“机会节点”来处理博弈中的不确定性问题,其中涉及一个外部力量(如自然或上帝)以随机方式影响博弈结果。通过这种方式,可以将不确定性因素纳入博弈模型中进行分析。此外,区分了外生不确定性(由外界随机事件引起的不确定性)和内生不确定性(由参与者的选择相互作用产生的不确定性),着重于后者是博弈理论分析的核心所在。

(2)信息集与博弈论分析

1)信息集概念

        本节介绍了信息集的概念,它是用来刻画参与者在博弈过程中所掌握信息的精确度或模糊性。信息集指的是同一参与者的若干节点组成,其中的节点对于该参与者来说是未知的,类似于被一片乌云遮住的天空,只知道需要做出选择但不确定当前所在的具体位置。此外,讨论了存在先验信念(如某节点被选中的概率)的情况下,这种信念需成为所有参与者的共同知识。在面对不完全信息的动态博弈时,参与者可能需要基于对手的策略和贝叶斯法则来生成自己的信念,强调了认知理性在做出决策中的重要性。

        要理解策略必须理解信息集。

2)案例-以硬币配对博弈为例引入信息集到博弈

        本段讨论了信息集和策略的重要性,并通过硬币配对博弈的游戏加以说明。首先介绍了信息集的概念,指出在某些情况下,(通过引入信息集就可以刻画参与者同时行动的情况。)尽管行动存在先后顺序,但由于某些参与者无法获取其他参与者的全部信息,可以视为同时行动。其次,强调了理解信息集对于正确制定和执行策略至关重要,尤其是在博弈论中分析决策过程时。

        博弈硬币配对游戏,有一二两个参与者,每一个参与者手里有一枚硬币。每个参与者自己可以游戏概述:选择手里的硬币是正面朝上还是反面朝上,两个参与者同时把手伸出来。如果两枚硬币都是正面朝上,那么参与者一赢,参与者二输,那么参与者就要把自己手中的一枚硬币输给参与者一。如果一个是正面朝上,一个是反面朝上,那么由参与者二营参与者一输,那么参与者一的话要输给参与者21枚银币。

        用虚线把参与者R的这两个节点连起来,表示一同进入参与者R的这个信息集。

        本次课程讨论了硬币配对游戏作为博弈问题的基本特征及其变体。首先,介绍了游戏中个体策略选择的重要性以及同一结果出现的概率差异。随后,通过增加参与者之间的利益相关性,将简单的硬币配对游戏转化为具有策略选择和利害关系的博弈问题。此外,强调了在博弈中,每个主体必须拥有策略选择空间及不同的利益是构成博弈的必要条件。

3)案例2-以孟晚舟时间为例建构中美政府的博弈树

        讨论了一次博弈的理论模型构建,具体使用华为CFO孟晚舟事件作为背景。此博弈涉及到中国与美国之间的互动,通过假设中国政府的行为可能是坚决型或不坚决型(强硬性或软弱性),探讨了博弈的多种可能性。博弈始于自然的选择,即中国政府的行为类型,随后美国作为挑战者面对中国政府可能的不同行为作出反应。该模型详细说明了信息集的概念,区分了单节信息集(仅有一个节点)和多节信息集(包含多个节点),以及这些信息集如何影响参与者制定策略。此外,还介绍了完美信息博弈的概念,即所有历史行动可追溯且明确的博弈情景。整个讨论强调了信息和不确定性在博弈过程中的重要性,并应用实际案例解析了博弈论的基本原理。

        凡是由这个虚线连起来的节点,就构成了美国政府的信息集。一旦进入这个信息集,美国政府知道该自己行动的,但是并不知道自己处于哪一个节点。比方说以这个虚线连起来的信息集为例,上面的那个节点对应于中国政府属于坚决型的,下面这个节点对于中国政府属于不坚决型的。中国是知道自己的类型的。

        中国在决策的时候并没有将上下节点用虚线连接起来。中国政府的两个上下两个节点,称为叫单节节点,或者说的话构成了单节信息集。就是只是由一个节点构成的信息机成为单节信息集。这对于参与者掌握的信息非常完美,他百分之百的确认自己就处于当前的这个节点。

        最后一个阶段,又轮到美国政府做决策,选择是退却还是推进他的斜坡的时候。这个时候的话,他仍然不知道中国政府的类型。所以它的两个节点还是构成了同一个信息集。这样在这个博弈中,美国就有两个信息集,两个信息集都是多节信息集。而中国也有两个信息集,两个信息集都是单节信息集。

        引进信息机的目的就是为了刻画参与者他在行动的时候,他所掌握的信息的那个状态大概的话有多精确,是用来刻画如果一个博弈树中的所有节点都没有用。

(3) 博弈理论中的完美回忆假定及其应用

1)完美回忆假定

        博弈理论分析要求参与者具备完美回忆能力,即不能遗忘过去的行为或知识。然而,在某些博弈情境下,如某个参与者无法区分其先前采取的行动导致的结果,将不符合这一假设。这种情况下,博弈过程可能无法准确反映参与者的真实策略选择,从而影响分析结果的有效性。

2)完美会议的判定条件

        讨论了完美会议的两个关键要求:1) 每个参与者的信息集与从根节点到终端点的路径至多相交一次;2) 对于到达同一信息集的任意两条路径,必须按相同顺序穿过相同信息集,并在这些信息集中做出相同的决策。

相关文章:

  • .NET MAUI Sqlite数据库操作(二)异步初始化方法
  • Mysql的增、删、查、改
  • 使用python绘制三维散点图
  • RK平台Android单独编译内核
  • 【打鼹鼠game】
  • 深度学习Day-20:DenseNet算法实战 乳腺癌识别
  • mysql在linux下安装与配置
  • AI 定位!GeoSpyAI上传一张图片分析具体位置 不可思议! ! !
  • 做外贸开发客户使用外贸软件有必要吗?
  • Ionic 创建 APP
  • 【Ubuntu20.04】安装XRDP远程桌面服务
  • scrapy爬取豆瓣书单存入MongoDB数据库
  • 算法:位运算题目练习
  • 图像分隔和深度成像技术为什么受市场欢迎-数字孪生技术和物联网智能汽车技术的大爆发?分析一下图像技术的前生后世
  • C#(C Sharp)学习笔记_封装【十八】
  • angular2开源库收集
  • CSS 三角实现
  • express.js的介绍及使用
  • IDEA常用插件整理
  • java B2B2C 源码多租户电子商城系统-Kafka基本使用介绍
  • js递归,无限分级树形折叠菜单
  • Laravel Telescope:优雅的应用调试工具
  • php ci框架整合银盛支付
  • Rancher-k8s加速安装文档
  • React-flux杂记
  • SAP云平台运行环境Cloud Foundry和Neo的区别
  • storm drpc实例
  • Windows Containers 大冒险: 容器网络
  • 类orAPI - 收藏集 - 掘金
  • 盘点那些不知名却常用的 Git 操作
  • 前端工程化(Gulp、Webpack)-webpack
  • 使用iElevator.js模拟segmentfault的文章标题导航
  • 优化 Vue 项目编译文件大小
  • 职业生涯 一个六年开发经验的女程序员的心声。
  • 转载:[译] 内容加速黑科技趣谈
  • 分布式关系型数据库服务 DRDS 支持显示的 Prepare 及逻辑库锁功能等多项能力 ...
  • 关于Kubernetes Dashboard漏洞CVE-2018-18264的修复公告
  • ​批处理文件中的errorlevel用法
  • # 数论-逆元
  • #!/usr/bin/python与#!/usr/bin/env python的区别
  • #include<初见C语言之指针(5)>
  • #在线报价接单​再坚持一下 明天是真的周六.出现货 实单来谈
  • (10)STL算法之搜索(二) 二分查找
  • (9)YOLO-Pose:使用对象关键点相似性损失增强多人姿态估计的增强版YOLO
  • (离散数学)逻辑连接词
  • (提供数据集下载)基于大语言模型LangChain与ChatGLM3-6B本地知识库调优:数据集优化、参数调整、Prompt提示词优化实战
  • (转)菜鸟学数据库(三)——存储过程
  • (转)负载均衡,回话保持,cookie
  • (转载)OpenStack Hacker养成指南
  • .bat批处理(一):@echo off
  • .L0CK3D来袭:如何保护您的数据免受致命攻击
  • .NET6使用MiniExcel根据数据源横向导出头部标题及数据
  • .Net的DataSet直接与SQL2005交互
  • .NET框架类在ASP.NET中的使用(2) ——QA
  • /proc/stat文件详解(翻译)