博弈论学习笔记(2)——完全信息静态博弈

 前言

这部分我们学习的是完全信息静态博弈,主要内容包括博弈论的基本概念、战略式博弈、Nash均衡、Nash均衡解的特性、以及Nash均衡的应用。

零、绪论

1、什么是博弈论

1)博弈的定义

博弈论:研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

完全理性的个人或群体发生直接相互作用的情形。博弈论研究这种情形下个人或群体的决策以及这种选择所导致的结果的理论。

2)博弈与传统决策的区别

传统的决策是从若干备选方案中选择一个有利方案,如出门带伞问题就是一个决策问题。而博弈是研究决策主体的行为发生直接相互作用时候的决策,在博弈中,决策主体的选择不仅与决策主体的偏好结构有关,而且与其他人的选择有关。

2、如何研究博弈论

1)完全理性假设的主要表现
  1. 参与人的偏好具有一致性

  2. 参与人对面临的决策问题具有完全的理解

  3. 参与人具有强大的逻辑推理能力和计算能力

2)共同知识是什么

如果有一种每个参与人都知道的“信息或事件”,并且每个参与人都知道每个参与人都知道它,每个参与人都知道每个参与人都知道每个参与人都知道它,……,如此等等,那么这种“信息”对于参与人而言就是共同知识。显然关于一个事件的共同知识这个概念比人们所熟悉的“相互知识”需要更多的信息,共同知识是无穷尽的“相互知识”。

有了参与人完全理性和参与人完全理性是共同知识这两个假设,就可以确保博弈过程的分析具有逻辑上的一致性。

3、博弈论研究的目的

1)什么是博弈问题的解

所有参与人都预测到的博弈结果,即参与人的一致性预测

将Nash均衡作为博弈问题的一致性预测,也就是博弈问题的解。

4、博弈论的主要分类

1)合作博弈与非合作博弈

决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议

2)静态博弈与动态博弈

根据参与人的先后顺序。

3)完全信息博弈与不完全信息博弈

参与人对其他参与人的特征,战略空间及支付函数在博弈开始时是否已知。

4)完美信息博弈与不完美信息博弈

注意完美信息博弈与完全信息博弈的比较

一、战略式博弈

1、基本概念

1)参与人

博弈中选择行动以最大化自己效用的决策主体

2)行动

参与人在博弈的某个时点的决策变量

3)行动组合(行动断面)

博弈中每个参与人采取一个行动的一种博弈情形

4)战略

参与人的行动规则,规定了参与人在每一种轮到自己行动的情形下,应该采取的行动。它是与博弈行动顺序相关的行动有序集,战略是行动的规则,而不是行动本身,作为行动规则,战略必须是完备的。

【特例】

在完全信息静态博弈中,不存在决策时序上的差异,所有参与人在同一决策时点即博弈开始那一时刻决策,因此所有参与人面临的决策情形只有一种。参与人的战略集与行动集相同。

5)战略组合

博弈中每个参与人采取战略组合中相应战略Si的一种博弈情形。

6)支付

参与人在博弈中的所得。参与人的支付就可表示为一种特定博弈情形(如行动组合或战略组合)下参与人得到的确定效用水平或期望效用水平。

7)信息

参与人所具有的有关博弈的所有的知识。

8)完美信息与完全信息

9)结果

博弈分析者所感兴趣的所有东西,如:均衡策略组合、均衡行动组合、均衡支付等。

10)均衡

所有参与人的最优的战略组合。在博弈论中,均衡是指所有个人的买卖规则(战略)的组合,均衡价格是这种战略组合的结果。

2、战略式博弈

1)战略式博弈的定义

战略式博弈是博弈问题的一种规范性描述,亦称为标准式博弈。

战略式博弈是一种相互作用的决策模型,这种模型假设每个参与人仅选择一次行动或行动计划(战略),并且这些选择是同时进行的。

二、Nash均衡

1、占优均衡

1)“囚徒困境”

理性的前提假设,使得每个小偷都有背离“抵赖,抵赖”的意愿,因此,小偷的选择会偏离“抵赖”,而选择“坦白”。

无论对方如何选择,每个小偷都会选择“坦白”,可以发现战略“坦白”具有这样的特点:无论对方怎样选择(选择“坦白”或者“抵赖”),“坦白”总是理性小偷的最优战略,而与其他小偷的选择无关。

在学习占优行为、重复剔除劣战略行为这章之前,不妨做一做下面这道题。

【收益矩阵的参数范围问题】

题解】

2)占优战略

参与人的最优战略与其他参与人的选择无关。无论其他参与人选择什么战略,参与人的最优战略总是唯一的。这样的最优战略我们称为“占优战略”(dominant strategy)

3)占优行为

在一个博弈问题中,如果某个参与人具有占优战略,那么只要这个参与人是理性的,他肯定就会选择他的占优战略。参与人的这种选择行为我们称为占优行为。占优行为是理性参与人选择行为的最基本特征。

4)占优战略均衡

如果所有的参与人都具有占优战略,那么只要参与人是理性的,肯定都会选择自己的占优战略。

博弈的结果就由参与人的占优战略共同决定。像这种由参与人的占优战略共同决定的博弈结果,称为占优战略均衡(dominant-strategy equilibrium)。

2、重复剔除劣战略行为

1)劣战略

2)剔除劣战略行为

3)重复剔除的占优均衡

4)弱劣战略

5)均衡结果是否与劣战略的剔除顺序有关

一般而言,如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱战略,均衡结果可能与剔除顺序有关

在重复剔除劣战略的过程中,需要注意:

  • 重复剔除劣战略均衡要求“理性”为“共同知识”

  • 一般而言,参与人的战略空间越大,需要剔除的步骤就越多,对“理性”的要求就越严格。

3、Nash均衡

1)什么是博弈问题的解
  1. 博弈分析是在博弈问题的结构参与人完全理性为共同知识下进行的;

  2. 对博弈问题的求解,等同于完全理性的参与人对博弈的求解;

  3. 博弈问题的解:所有参与人的一致性预测。

2)什么是Nash均衡

3)求解Nash均衡的方法

划线法】

在两人博弈中,相互构成最优战略的战略组合就是Nash均衡。

箭头法】

在两人博弈中,一个战略组合只有在两个参与人都不愿意偏离的情况下才能构成Nash均衡。计算步骤如下:

  1. 对于每个战略组合,检查是否有参与人会偏离

  2. 找出没有参与人会偏离的战略组合

4)Nash均衡 VS 占优战略均衡 VS 重复剔除的占优均衡

4、混合战略Nash均衡

1)混合战略

以一定的概率分布来选择自己战略的行为,在博弈中称之为混合战略。与此相对应,参与人在给定信息下只选择一种特点战略,成为纯战略。

混合战略解释了一个参与人对其他参与人所采取的行动的不确定性,它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略混合战略为定义在纯战略集上的一个概率分布。

2)混合战略的支付

对于混合战略,参与人的支付是不确定的,此时,参与人关心的是支付的期望收益

3)混合战略与混合战略组合

4)纯战略-混合战略 VS 完全混合战略

5)混合战略Nash均衡

6)最优混合战略的特性

7)支集

8)最优反应的引理

5、混合战略Nash均衡的求解

1)等值法

【举例说明】

2)Wilson奇数定理

3)支撑是什么

掌握支撑的写法

4)支撑求解法

支撑法求解过程中可能遇到的问题:

5)支撑法求解典例

6)支撑法的问题,计算量大

用剔除劣战略的方法,排除支撑!!!

7)规划求解法

8)规划法求解典例

从理论上来讲,这两种方法对有限战略式博弈都是适用的,但从以上例子的求解过程来看,都存在着计算过程复杂,计算量大等问题,尤其是对多人(即参与人人数大于2)博弈问题。当参与人人数大于2时,使用支撑法,就必须求解非线性方程组;而使用规划法,就必须求解一个无论是目标函数还是约束条件都是非线性的规划问题。

三、Nash均衡解的特性

1、Nash均衡的意义

1)一致性预测

Nash均衡是博弈中的一种一致性预测——如果所有参与人预测一个特点的Nash均衡会出现,那么所有参与人都不会偏离,这个Nash均衡就会出现。

2)Nash均衡的特点

对任一个参与人i,在给定其他参与人选择的情况下,均衡战略是自己的最优战略

3)一般解的定义

2、Nash均衡解的存在性

1)不同均衡概念之间的关系

2)Nash均衡的存在性定理

每一个有限的战略式博弈至少存在一个Nash均衡(包括纯战略和混合战略Nash均衡)。

3、Nash均衡解的多重性

1)什么是Nash均衡的多重性问题

传统的博弈论研究的问题或许并不是如何找到博弈的Nash均衡(即存在性问题),而是在博弈的多个Nash均衡中选择一个合理的均衡(即多重性问题)

但事实上,当在一个博弈中存在多个Nash均衡时,目前还没有一个一般的理论能证明哪个Nash均衡结果一定会出现。

2)如何解决Nash均衡的多重性问题

1、均衡精炼的方法

从博弈解的定义入手,在Nash均衡的基础上,通过定义更加精炼的博弈解如子博弈精炼Nash均衡、精炼贝叶斯Nash均衡等,剔除Nash均衡中不合理的均衡。这种解决Nash均衡多重性的思路具有普遍性,对所有的博弈问题都适用;

均衡精炼的方法可以称为规范式的方法,其它的方法称为非规范式的方法。

2、非规范式的方法

  • 焦点效应

  • 相关均衡

3)什么是焦点效应

在一个具有多重均衡的博弈中,趋向于将参与人的注意力集中到一个均衡的任何事情,都可能使参与人全都预期并随之实行这个均衡,就像一个自行应验的预言一样。

Schelling将这种现象称之为焦点效应 (focal-point effect)。

在焦点效应中具有某种使它显著地区别于所有其它均衡性质的均衡,被称为“焦点均衡”(focal equilibrium)。

结合“性别战”的例子理解,详见PPT

  1. 博弈的现实状况或背景也会将博弈引向特定的均衡。

  2. 此外,“焦点效应”在某些博弈中还可能由均衡战略自身的性质来确定。

但是需要注意的是,聚焦因素只有针对Nash均衡时才可能是有效的。

4)什么是廉价磋商

类似于“性别战”中这种博弈之前进行的沟通或商议,在博弈分析中称之为具有通信的博弈或“廉价磋商”(cheap talk)。

在博弈分析中,将参与人在博弈开始之前,不花任何成本所达成的、对参与人没有约束力的协议称为“廉价磋商”。

5)什么是相关均衡

在“性别战”博弈中,夫妻双方通过长期的共处,在周末娱乐项目的选择上可能会形成这样的习惯:双方根据周末的天气状况来选择娱乐项目。

便得到了一种解决Nash均衡多重性问题的方式:让参与人根据某个共同观测到的信号(如“性别战”中的天气状况)来选择行动。

如果参与人根据信号选择行动的规则本身能够构成一个Nash均衡,那么参与人就可能会根据某个共同观测到的信号来选择行动。这种由参与人的行动规则所构成的Nash均衡,就是Aumann定义的“相关均衡”(correlated equilibrium)。

四、Nash均衡的应用

1、Cournot寡头竞争模型

该模型研究了寡头垄断市场中,企业追求利润最大化时的决策问题。

1)Cournot模型的基本假设

2)什么是反应函数

上面两个函数分别描述了给定对手的产量,企业 i 应该如何反应,因而分别称为企业1与企业2的反应函数(reaction function)。

反应函数意味着每个企业的最优产量是另一个企业的产量的函数,两个反应函数的交点便是Nash均衡点。

3)Cournot模型的计算

联合垄断市场、“垄断最优的情形在两个寡头的时候是无法达到”等内容详见PPT

2、Bertrand寡头竞争模型

在寡头垄断市场中,企业关心更多的可能是自己的产品在市场上的价格,而不是生产多少产品,也就是说,企业进行的可能是价格竞争而不是产量竞争。

1)Bertrand模型的基本假设

2)Bertrand模型的计算

3)Bertrand悖论

3、Hotelling寡头竞争模型

在Hotelling价格竞争模型中,Hotelling通过引入产品在空间位置上的差异,巧妙地解决了产品的差异形式的描述问题。

在Hotelling价格竞争模型中,产品虽然仍是同质的,但其在空间位置上有差异,因而对于不同位置的消费者其运输成本不同,由此导致产品不再是完全替代的。

1)Hotelling模型的基本假设

2)Hotelling模型的求解

通过引入产品的位置差异,使得企业的均衡利润不再为0,而企业的定价也大于产品的边际成本,在一定程度上解释了Bertrand悖论。

在上面的分析中,我们将两个企业固定于线性城市的两端。如果允许企业在选择价格的同时还可以选择位置,那么两个企业都会选择线性城市的中点(即[0,1]区间的中点),而当两个企业都位于中点时,Bertrand均衡则成为模型的唯一均衡。

4、Hardin公共财产问题

公共资源被过度使用,如草原沙化,渔业资源枯竭以及各种矿产资源的过度开发等等,使人类社会的生存面临着极大的挑战。以G. Hardin的公共财产模型为例,分析人们的利己行为如何使得公共资源被过度使用。

具体求解过程详见PPT

5、混合战略Nash均衡的应用

1)小偷-守卫博弈

2)监督博弈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/111264.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

前度开发面试题

面试题总结 vue页面跳转会经过两个钩子函数beforeEach、afterEach 组见守卫 beforeRouteEnter前置组见守卫 *beforeRouteUpdate更新之前 watch和computed区别 数据没有改变,则 computed 不会重新计算)。若没改变,计算属性会立即返回之前缓…

【Postgres】Postgres常用命令

文章目录 1、导出数据库某张表2、导入某张表到数据库3、查看数据库占用磁盘页数情况4、查看数据库大小5、查看数据表大小6、查看索引大小7、对数据库中表索引按照大小排序8、对数据库中表按照大小排序9、回收空间(建议先回收指定表)10、设置主键自增序列…

想做短视频,但是没有经验,不会拍、不会剪、不会写脚本怎么办?

现在很多人都准备进入短视频领域,让自己多一份收入。不过有个很现实的问题,不会拍、不会剪、也不会写脚本怎么办,还能做短视频吗? 如果是完全不会,那么初期肯定是要学习一些基础知识的,比如基础的拍摄技巧…

k8s从私有仓库拉取镜像

从私有仓库拉取镜像 | Kubernetes 准备开始 你必须拥有一个 Kubernetes 的集群,同时你必须配置 kubectl 命令行工具与你的集群通信。 建议在至少有两个不作为控制平面主机的节点的集群上运行本教程。可以通过 Minikube 构建一个你自己的集群,或者你可以…

二十二、Arcpy批量波段组合——结合Landat数据城市建成区提取

一、前言 其实波段组合和GIS中栅格计算有点类似,实质上就是对每个像素点对应的DN值进行数学计算,也就是可以进行运算表达式是三个或多个变量相加、相减……每一个变量对应于一个图像数据,对这三个或多个图像数据求值并输出结果图像。 二、具体操作 1、实验具体目标 将202…

英语——歌曲篇——only you

《only you》(只有你)赏析 很多人都听过The Platters(派特斯乐队)演唱的《only you》(只有你)这首歌曲,尤其是看过在周星驰和罗家英在《大话西游》里面演绎的"无厘头"版本后。 不过,又有几人知道,这首歌曲原来是经典浪漫影片《罗马…

【Docker】Linux网络命名空间

命名空间 Namespace是Linux提供的一种对于系统全局资源的隔离机制;从进程的视角来看,同一个namespace中的进程看到的是该namespace自己独立的一份全局资源,这些资源的变化只在本namespace中可见,对其他namespace没有影响。容器就…

python 练习 在列表元素中合适的位置插入 输入值

目的: 有一列从小到大排好的数字元素列表, 现在想往其插入一个值,要求: 大于右边数字小于左边数字 列表元素: [1,4,6,13,16,19,28,40,100] # 方法: 往列表中添加一个数值,其目的方便元素位置往后…

操作系统:内存管理(二)虚拟内存管理

一战成硕 3.2 虚拟内存管理3.2.1 虚拟内存的基本概念3.2.2 请求分页管理方式3.2.3 页框分配3.2.4 页面置换算法3.2.5 抖动和工作集 3.2 虚拟内存管理 3.2.1 虚拟内存的基本概念 3.2.2 请求分页管理方式 页表机制 缺页中断机制 地址变换机构 3.2.3 页框分配 驻留集大小 内…

一致性哈希揭秘,深入解析其工作原理

前言 在进行一致性哈希介绍前,先思考2个问题: 什么是Hash一致性Hash和Hash的关系是什么 对于第一个问题Hash的定义 Hash也成散列,基本原理就是把任意长度的输入,通过hash算法变成固定长度的输出。 对于第二个问题&#xff0c…

gitee上传项目

目录 首先在gitee新建一个仓库 接下来创建好项目,先找到生成公钥SSH的目录 接下来是生成公钥SSH 仓库创建好后,接着开始链接项目 首先在gitee新建一个仓库 接下来创建好项目,先找到生成公钥SSH的目录 接下来是找目录:C盘&a…

Karate轻松实现自动API测试

如果您想做自动API测试,但没有编程背景,那么你必须要给Karate一个机会! Karate由Intuit作为开源工具发布。该工具旨在用于自动API测试,并具有使API测试变得轻而易举且实际上令人愉快的所有必需功能。 与需要大量编码的其他自动化…

项目综合实训,vrrp+bfd,以及策略路由的应用

目录 一. 项目需求 二. Visio设备画图 三. 设备选型 三.vlan规划 四.Ip地址规划 五.实验拓扑图 六.配置过程及结果 项目需求 1.S1作为VLAN10的主网关和根桥,S2作为v…

JavaScript从入门到精通系列第二十六篇:详解JavaScript中的Math对象

大神链接:作者有幸结识技术大神孙哥为好友,获益匪浅。现在把孙哥视频分享给大家。 孙哥连接:孙哥个人主页 作者简介:一个颜值99分,只比孙哥差一点的程序员 本专栏简介:话不多说,让我们一起干翻J…

storage数据存储问题,不能存undefined

这篇文章分享一下自己使用sessionStorage遇到的一个小问题,以后遇到要避坑。 需求是easyui表格的单元格编辑,点击保存的时候会结束当前行的编辑,然后修改editingId(当前编辑行记录的ID)。 待解决问题 如图&#xff0c…

【Docker】Docker的应用包含Sandbox、PaaS、Open Solution以及IT运维概念的详细讲解

前言 作者简介: 辭七七,目前大二,正在学习C/C,Java,Python等 作者主页: 七七的个人主页 文章收录专栏: 七七的闲谈 欢迎大家点赞 👍 收藏 ⭐ 加关注哦!💖&…

Spring MVC的常用注解(设置响应篇)

目录 1.返回静态页面 2.返回数据 3.返回HTML代码片段 4.返回json 5.设置状态码 6.设置Header (1).设置 Content-Type (2).设置其他Header 推荐先看前篇博客Spring MVC的常用注解(接收请求数据篇) 接收…

UE4/UE5 设置widget中text的字体Outline

想要在蓝图中控制Widget 中的 text字体,对字体outline参数进行设置。 但是蓝图中无法直接获取设置outline参数的方法: 没有outline相关的蓝图函数 该参数本身是在Font类别下的扩展,所以只要获取设置Font参数即可进行outline的设置 text连出…

11、插件注入到vue实例中

新建插件 nuxt-demo2\plugins\vue-inject.js import Vue from "vue"Vue.prototype.$test function (str) {console.log(str) }配置插件 nuxt-demo2\nuxt.config.js export default {...// Plugins to run before rendering page: https://go.nuxtjs.dev/config-…

python基于VGG19实现图像风格迁移

目录 1、原理 2、代码实现 1、原理 图像风格迁移是一种将一张图片的内容与另一张图片的风格进行合成的技术。 风格(style)是指图像中不同空间尺度的纹理、颜色和视觉图案,内容(content)是指图像的高级宏观结构。 实…
最新文章