当前位置: 首页 > news >正文

纳什均衡:博弈论中的运作方式、示例以及囚徒困境

文章目录

  • 一、说明
  • 二、什么是纳什均衡?
    • 2.1 基本概念
    • 2.2 关键要点
  • 三、理解纳什均衡
  • 四、纳什均衡与主导策略
  • 五、纳什均衡的例子
  • 六、囚徒困境
  • 七、如何原理和应用
    • 7.1 博弈论中的纳什均衡是什么?
    • 7.2 如何找到纳什均衡?
    • 7.3 为什么纳什均衡很重要?
    • 7.4 如何计算纳什均衡?
    • 7.5 纳什均衡的局限性是什么?
  • 八、后记

关键词:Nash Equilibrium、Dominant Strategy

一、说明

   博弈论者使用纳什均衡来分析多个决策者战略互动的结果。在战略互动中,每个决策者的结果取决于其他人的决策以及他们自己的决策。纳什思想背后的简单见解是,如果孤立地分析多个决策者的决策,就无法预测他们的选择。相反,我们必须问每个玩家在考虑到玩家对其他人的期望后会怎么做。纳什均衡要求玩家的选择是一致的:没有玩家希望在其他人做出决定的情况下撤销自己的决定。

二、什么是纳什均衡?

2.1 基本概念

   在博弈论中,纳什均衡是非合作博弈中最常用的解决方案概念。纳什均衡是指没有玩家可以通过改变自己的策略(保持其他玩家的策略不变)来获利的情况。[1]纳什均衡的概念可以追溯到古诺时代,他在 1838 年将其应用于寡头垄断竞争模型。[2]

   纳什均衡表现为一种“饱和态”,如果每个玩家都选择了一种策略 (基于游戏中迄今为止发生的事情的行动计划),并且在其他玩家保持不变的情况下,没有人可以通过改变自己的策略来增加自己的预期收益。表现为“势均力敌”的状态。
   纳什均衡是博弈论中的一个概念,指博弈达到最优结果。这是一种不鼓励个体玩家偏离其初始策略的状态。玩家知道对手的策略,但仍然不会偏离他们最初选择的策略,因为这仍然是每个玩家的最佳策略。

   总体而言,假设其他玩家的策略保持不变,个人无法从改变行动中获得增量收益。然而,一场游戏可能有多个纳什均衡,也可能根本没有。

2.2 关键要点

  • 纳什均衡是博弈论中的一个决策定理,该定理指出玩家可以通过不偏离其初始策略来实现期望的结果。
  • 在纳什均衡中,每个玩家的策略在考虑其他玩家的决策时都是最优的。每个玩家都会获胜,因为每个人都会得到他们想要的结果。
  • 囚徒困境是一个常见的博弈论例子,它充分展示了纳什均衡的效果。
  • 纳什均衡通常与主导策略一起讨论,主导策略指出,无论对手使用何种策略,行为者选择的策略将在所有可能使用的策略中产生更好的结果。
  • 纳什均衡并不总是意味着选择最优策略。
    1

三、理解纳什均衡

   纳什均衡以其发明者美国数学家约翰·纳什的名字命名。它被认为是博弈论中最重要的概念之一,它试图从数学和逻辑上确定游戏参与者应采取的行动,以确保自己获得最佳结果。

   纳什均衡之所以被认为是博弈论中如此重要的概念,是因为它的适用性。纳什均衡可以纳入从经济学到社会科学等广泛的学科。

   为了快速找到纳什均衡或查看它是否存在,请向其他玩家透露每个玩家的策略。如果没有人改变他们的策略,那么纳什均衡就被证明了。

四、纳什均衡与主导策略

   纳什均衡经常与占优策略进行比较,两者都是博弈论中的策略。纳什均衡指出,参与者的最佳策略是在了解对手策略的情况下坚持其初始策略,并且所有参与者都保持相同的策略。

   主导策略断言,无论对手使用何种策略,行为者选择的策略将在所有可能使用的策略中产生更好的结果。

   所有博弈论模型只有当参与的玩家都是“理性主体”时才有效,这意味着他们渴望特定的结果,试图选择最优结果,在决策中考虑不确定性,并在选择上采取现实态度。
   这两个术语相似但略有不同。纳什均衡表明,如果任何一个玩家改变策略而其他所有玩家都保持策略,则不会有任何收获。主导策略断言,无论其他玩家选择了什么策略,玩家都会选择一种能够带来最佳结果的策略。主导策略可以包含在纳什均衡中,而纳什均衡可能不是游戏中的最佳策略。

五、纳什均衡的例子

   想象一下汤姆和萨姆之间的游戏。在这个简单的游戏中,两位玩家都可以选择策略 A,获得 1 美元,或者策略 B,损失 1 美元。从逻辑上讲,两位玩家都会选择策略 A,并获得 1 美元的收益。

   如果您向 Tom 透露 Sam 的策略,反之亦然,您会发现没有玩家偏离原始选择。了解其他玩家的举动意义不大,也不会改变任何一方的行为。结果 A 代表纳什均衡。

纳什均衡示例
在这里插入图片描述

六、囚徒困境

   囚徒困境是博弈论中分析的一种常见情况,可以运用纳什均衡。在这个博弈中,两名罪犯被捕,各自被单独监禁,无法与对方交流。检察官没有证据定罪这对罪犯,所以他们给每个囚犯一个机会,要么背叛对方,作证对方犯了罪,要么合作,保持沉默。

   如果两名囚犯互相背叛,则每人将被判处五年监禁。如果 A 背叛 B,但 B 保持沉默,则囚犯 A 将被释放,囚犯 B 将被判处十年监禁,反之亦然。如果双方都保持沉默,则每人将被判处一年监禁。

   在这个例子中,纳什均衡是两个参与者互相背叛。尽管相互合作会带来更好的结果,但如果一个囚犯选择相互合作而另一个囚犯不选择,那么其中一个囚犯的结果会更糟。

七、如何原理和应用

7.1 博弈论中的纳什均衡是什么?

   博弈论中的纳什均衡是指玩家在考虑到对手的策略后,将继续执行自己选择的策略,而没有偏离该策略的动机。

7.2 如何找到纳什均衡?

   要在游戏中找到纳什均衡,就必须模拟出每种可能的情况以确定结果,然后选择最佳策略。在双人游戏中,这将考虑两个玩家可以选择的可能策略。如果两个玩家都不了解所有信息并改变策略,则会出现纳什均衡。

7.3 为什么纳什均衡很重要?

   纳什均衡很重要,因为它可以帮助玩家根据自己的决策和其他相关方的决策确定最佳收益。纳什均衡可以应用于生活的方方面面,从商业策略到卖房,从战争到社会科学等等。

7.4 如何计算纳什均衡?

   没有特定的公式来计算纳什均衡。可以通过对给定游戏中的不同场景进行建模来确定每个策略的收益以及哪种策略是最佳选择。

7.5 纳什均衡的局限性是什么?

   纳什均衡的主要限制是它要求玩家了解对手的策略。只有当玩家了解对手的策略并选择继续使用当前策略时,纳什均衡才会发生。

   在大多数情况下,例如在战争中(无论是军事战争还是竞价战争),个人很少知道对手的策略或他们想要的结果。与主导策略不同,纳什均衡并不总是导致最优结果。它只是意味着个人根据他们掌握的信息选择最佳策略。

   此外,在与相同对手进行的多场游戏中,纳什均衡并没有考虑过去的行为,而过去的行为往往可以预测未来的行为。

八、后记

   纳什均衡是博弈论的一个组成部分,它断言玩家在了解对手的策略的情况下会继续使用他们选择的策略,因为他们没有改变路线的动机。纳什均衡可以应用于各种现实生活中的情况,根据你的决定以及对对手决定的了解来确定在某种情况下的最佳收益是什么。

相关文章:

  • 如何将AndroidStudio和IDEA的包名改为分层级目录
  • python --监听鼠标事件
  • k8s——安全机制
  • 【机器学习】我们该如何评价GPT-4o?GPT-4o的技术能力分析以及前言探索
  • DevOps入门
  • Tomcat相关概述和部署
  • 力扣第417题测试程序
  • Java微服务实战:使用Spring Boot构建高效服务
  • kv视频如何转码mp4格式,kv转换mp4最简单方法
  • 填充每个节点的下一个右侧节点指针-力扣
  • Vuex3学习笔记
  • Linux fallocate工具用于预分配或释放文件空间的块
  • 应用解析 | 面向智能网联汽车的产教融合解决方案
  • 代码随想录算法训练营第三十二天|122.买卖股票的最佳时机II 55. 跳跃游戏 45.跳跃游戏II
  • debian12安装时分区方案
  • angular组件开发
  • co模块的前端实现
  • JS创建对象模式及其对象原型链探究(一):Object模式
  • JS数组方法汇总
  • PHP的Ev教程三(Periodic watcher)
  • rc-form之最单纯情况
  • Redis学习笔记 - pipline(流水线、管道)
  • SpringCloud集成分布式事务LCN (一)
  • windows下如何用phpstorm同步测试服务器
  • 表单中readonly的input等标签,禁止光标进入(focus)的几种方式
  • 关于springcloud Gateway中的限流
  • ------- 计算机网络基础
  • 简单数学运算程序(不定期更新)
  • 嵌入式文件系统
  • 物联网链路协议
  • 一份游戏开发学习路线
  • ​ 全球云科技基础设施:亚马逊云科技的海外服务器网络如何演进
  • ​​​【收录 Hello 算法】10.4 哈希优化策略
  • ​卜东波研究员:高观点下的少儿计算思维
  • (13)DroneCAN 适配器节点(一)
  • (4) PIVOT 和 UPIVOT 的使用
  • (C语言)fread与fwrite详解
  • (zt)最盛行的警世狂言(爆笑)
  • (二)windows配置JDK环境
  • (二十一)devops持续集成开发——使用jenkins的Docker Pipeline插件完成docker项目的pipeline流水线发布
  • (附源码)计算机毕业设计SSM智能化管理的仓库管理
  • (全部习题答案)研究生英语读写教程基础级教师用书PDF|| 研究生英语读写教程提高级教师用书PDF
  • (十一)图像的罗伯特梯度锐化
  • (一)appium-desktop定位元素原理
  • (正则)提取页面里的img标签
  • (转)EOS中账户、钱包和密钥的关系
  • (转)Unity3DUnity3D在android下调试
  • (转)winform之ListView
  • *++p:p先自+,然后*p,最终为3 ++*p:先*p,即arr[0]=1,然后再++,最终为2 *p++:值为arr[0],即1,该语句执行完毕后,p指向arr[1]
  • .NET 回调、接口回调、 委托
  • .NET 药厂业务系统 CPU爆高分析
  • .NET/C# 的字符串暂存池
  • .NET的数据绑定
  • .net利用SQLBulkCopy进行数据库之间的大批量数据传递
  • @configuration注解_2w字长文给你讲透了配置类为什么要添加 @Configuration注解