论文导读 | 10月专题内容精选:人的预测

编者按

本次论文导读,编者选择了10月份OR和MS上与"人的预测"有关的三篇文章,分别涉及群体智慧的提取,个体序列预测的评估,以及决策者对风险的扭曲感知在分布式鲁棒优化中的应用。其中,从基于"生成式可能世界状态模型"(GPWM)进行群体预测的聚合,到使用严格的序贯检验模型来比较预测者的表现,本次选取的三篇文章对"人的预测"相关的数学建模、统计分析及其在优化问题中的应用都有一定启发,希望能引起相关读者的兴趣。

推荐文章1

● 题目:A Bayesian Hierarchical Model of Crowd Wisdom Based on Predicting Opinions of Others 

基于他人意见预测的群体智慧贝叶斯层次模型

● 期刊:Management Science

 原文链接:https://doi.org/10.1287/mnsc.2023.4955

 发表日期:October 19, 2023

● 作者:John McCoy, Drazen Prelec

● 关键词

◦ Wisdom of crowds 群体智慧

◦ Expertise 专家知识

◦ Bayesian hierarchical model 贝叶斯层次模型

◦ Surprisingly popular answer 令人惊讶的流行答案

● 主要内容

  • 本文的背景知识是关于群体智慧的提取方法和挑战。群体智慧是指多个人的集体智慧比单个个体更强大,可以应用于企业决策、市场研究、公共政策和医疗保健等领域。文章介绍了一些提取群体智慧的方法,如统计聚合信息和识别专业知识。然而,这些方法存在一些弱点,如无法考虑个体之间的信息差异和洞察力差异,以及无法准确获取世界先验知识和信号矩阵。文章提出了一种新的方法,称为generative possible worlds model (GPWM),以解决这些问题。

  • 本文的实现过程是通过引入、探索和实证验证generative possible worlds model (GPWM)。作者认为GPWM是将频率学派元素转化为贝叶斯群体智慧推断模型的自然而必要的一步。作者在多个实证数据集上评估了模型的性能,包括分类和概率数据,并将其与标准的单问题群体智慧方法以及现有的两个贝叶斯层次模型进行了比较。GPWM和现有的贝叶斯层次聚合模型之间的区别在于,现有的贝叶斯层次聚合模型将正确答案与共识联系起来,而GPWM则不做这个假设。现有的模型假设共识是正确答案,而GPWM允许多数信号在所有问题上都是错误的可能性。即使在这种极端情况下,GPWM原则上也可以恢复正确答案,因为人们对其他人的预测提供了关于正确信号的概率的额外信息。此外,现有的贝叶斯层次聚合模型依赖于学习受访者级别的参数,而GPWM可以使用关于他人的预测来推断问题级别的潜在参数,从而获得正确答案,而无需在多个问题上学习个体受访者的信息。

    • 预测回答真的比例(即预测别人的预测)在GPWM模型中起到了重要的作用。根据论文中的信息,预测回答真的比例可以帮助揭示参与者对信息的共享程度以及谁拥有不被广泛共享的信息的信念。如果理性的参与者在预测自己处于少数派的情况下仍然给出特定的判断,那么这表明他们相信自己拥有不被广泛共享的知识或洞察力。通过比较投票预测和实际投票,可以帮助了解参与者对信息在群体中的普遍程度以及谁拥有不被广泛共享的信息的信念。此外,预测回答真的比例还可以帮助确定在不同可能的世界状态下,群体投票的分布情况。这对于正确解释群体中投票分布是必要的,因为仅仅知道群体中70%的人投票“是”并不能得出最佳答案是“是”,还需要知道在不同可能的世界状态下群体会如何投票。因此,预测回答真的比例在模型中有助于获取关于群体中投票分布的信息,从而提高群体智慧的准确性和可靠性。

  • 作者在实验中采用了多个研究来评估模型的性能。根据论文中的信息,其中三个研究是关于美国州首府的问题,参与者需要判断每个问题的答案是真还是假,并预测回答真的比例。这三个研究分别在麻省理工学院和普林斯顿大学的实验室中进行。另外两个研究是关于20世纪艺术品市场价格的问题,一个研究中参与者是艺术专业人士,主要是画廊所有者,另一个研究中参与者是没有学习过艺术或艺术史课程的研究生。参与者需要判断90件20世纪艺术品的市场价格,并将其分为两个价格范围:低于30,000美元和高于30,000美元。在这些研究中,参与者除了回答问题和预测比例外,还需要给出他们的自信度。具体的实验协议和数据分析细节可以在论文的在线附录中找到。

推荐文章2

● 题目:Comparing Sequential Forecasters 

比较序列时间预测者

● 期刊:Operations Research

 原文链接:https://doi.org/10.1287/opre.2021.0792

 发表日期:October 17, 2023

● 作者:Yo Joong Choe, Aaditya Ramdas

● 关键词

◦ anytime valid sequential inference 任意时间有效的序贯推理

◦ confidence sequences 信心序列

◦ e-processes e-过程

◦ forecast evaluation 预测评估

◦ nonparametric statistics 非参数统计

● 主要内容

◦ 本文的背景是关于预测能力比较的问题。文章指出,尽管预测在各个领域中非常普遍,但在如何正式比较不同预测者的预测能力方面并不明显,特别是在预测者针对一系列结果进行预测的顺序设置中。例如,文章提到了2019年世界大赛每场比赛的概率预测,但我们不清楚如何有效地建模随时间变化的棒球比赛结果,并且对于每个预测者如何得出预测也没有完整的信息。文章通过观察这些预测和结果的过程,使用置信区间序列来评估预测者之间的差异,并量化这种差异是否可以归因于偶然或运气。这种评估方法不需要对现实或预测方法做出假设。

◦ 本文设计了一种新颖的顺序推断程序,用于估计预测分数的时变差异。这些程序使用了连续监测的置信区间序列,这些序列在任意数据相关的停止时间点上都是有效的。置信区间的宽度是根据分数差异的底层方差自适应调整的。这些程序的构建基于博弈论统计框架,进一步识别了用于顺序检验弱零假设的e-processes和p-processes,即一个预测者在平均情况下是否优于另一个预测者。这些方法不对预测或结果做分布假设;主要定理适用于任何有界分数,而后续提供了针对无界分数的替代方法。

  •   本文的模型主要是基于预测得分的差异来评估预测者的能力。模型定义了点预测得分差异和其经验估计。通过计算累积的差异和,可以构建一个鞅(martingale)。对于所有的时间点,通过构建指数测试超鞅(exponential test supermartingales),可以对累积的差异和进行统一且非渐近的界定,从而完成估计和覆盖。

  • 停止时间的概念在本文中涉及是因为我们希望能够在任意数据依赖的停止时间上进行有效的推断和比较不同预测者的预测能力。在预测任务中,我们通常会在一定的时间范围内观察预测者的预测和实际结果。停止时间是指我们选择观察预测者的预测和实际结果的时间点。通过引入停止时间的概念,我们可以更准确地评估预测者的预测能力,并进行比较。这种方法可以避免在固定时间点上进行比较时可能出现的偏差和误导。因此,停止时间的概念在本文中起到了关键的作用。

本文使用真实数据进行了实证验证。在棒球方面,研究者比较了不同预测者对2019年世界大赛每场比赛的概率预测。在天气预报方面,研究者比较了不同预测者使用统计后处理方法的集合天气预报。此外,研究者还在模拟数据上验证了他们的方法,并与固定时间和渐近置信区间进行了比较。

推荐文章3

● 题目:Distributionally Robust Optimization Under Distorted Expectations 

在扭曲期望下的分布式鲁棒优化

● 期刊:Operations Research

 原文链接:https://doi.org/10.1287/opre.2020.0685

 发表日期:October 10, 2023

 作者:Jun Cai, Jonathan Yu-Meng Li, Tiantian Mao

● 关键词

◦ distributionally robust optimization 分布式鲁棒优化

◦ distortion risk measure 扭曲的风险度量

◦ convex risk measure 凸风险度量

◦ convex envelope 凸包

● 主要内容

◦ 本文的是关于分布鲁棒优化(Distributionally Robust Optimization,DRO)在处理决策优化中的分布不确定性问题的重要范式。在决策者不是风险中性的情况下,DRO中最常用的方案是使用期望效用函数来捕捉风险态度。然而,本文提出了一种替代方案,即使用双重期望效用(dual expected utility)来处理决策者的风险态度。在这种方案中,通过应用畸变函数将物理概率转化为主观概率,从而得到一个被称为畸变期望的结果,该畸变期望能够捕捉决策者的风险态度。与期望效用函数线性地依赖概率不同,在双重方案中,畸变期望通常是概率的非线性函数。

◦ 扭曲期望是一种模拟决策者风险态度的方法。与线性依赖概率的期望效用函数不同,在扭曲期望的方案中,扭曲期望通常是概率的非线性函数。这种非线性性质使得扭曲期望能够更灵活地捕捉决策者的风险态度,包括对极端结果的过度权重或偏好。这个扭曲函数是一个非递减函数,并且满足一些特定的条件。在实践中,常用的扭曲函数包括累积概率理论中的反S形扭曲函数。通过使用扭曲期望来模拟决策者的风险态度,我们可以更准确地在决策优化中反映决策者对不确定性的态度。

◦ 本文强调了基于扭曲期望构建的分布鲁棒优化问题的计算可行性,并且表明在许多情况下,可以通过求解基于某个凸扭曲函数构建的替代分布鲁棒优化问题来解决这个问题,后者通常可以通过凸优化技术来精确或近似地求解。本文的DRDRO框架的可行性是建立在分析的基础上的,该分析表明,当根据基于矩的模糊集绘制的最坏情况分布进行评估时,具有非凸扭曲函数的扭曲期望总是给出与其凸对应物等价的风险评估。此外,本文还提供了一个必要条件,用于判断模糊集合是否满足这种等价性。值得注意的是,本文还提到了对于其他类型的模糊集,如基于距离的模糊集,是否可以获得类似的等价结果,这是一个自然的问题。

◦ 数值实验的结果显示,当决策者在面对分布不确定性时过度关注极端结果时,最优决策会变得更加风险规避,并且随着对极端结果的权重增加,决策者试图对冲的最坏情况分布也会发生变化。数值实验还展示了使用扭曲期望来进行决策时的一些情况。具体来说,数值实验使用了逆S形扭曲函数,并应用于一个具体的案例,该案例涉及到运输成本的不确定性。数值实验中使用的数据来源是根据论文中提供的信息进行的模拟。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/185479.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

红队攻防实战之从边界突破到漫游内网(无cs和msf)

也许有一天我们再相逢,睁大眼睛看清楚,我才是英雄。 本文首发于先知社区,原创作者即是本人 本篇文章目录 网络拓扑图: 本次红队攻防实战所需绘制的拓扑图如下: 边界突破 访问网站: http://xxx.xxx.xxx…

Flink 常用物理分区算子(Physical Partitioning)

Flink 物理分区算子(Physical Partitioning) 在Flink中,常见的物理分区策略有:随机分配(Random)、轮询分配(Round-Robin)、重缩放(Rescale)和广播(Broadcast)。 接下来,我们通过源码和Demo分别了解每种物理分区算子的作用和区别。 (1) 随机…

2024北京林业大学计算机考研分析

24计算机考研|上岸指南 北京林业大学 特色优势 Characteristics & Advantages:信息学院创建于2001年,是一个年轻而有朝气的学院。学院秉承“结构、特色、质量、创新”的八字方针,坚持以“质量提升、行业融合”为核心的内涵式发展战略&am…

Pycharm创建项目新环境,安装Pytorch

在python项目中,很多项目使用的各类包的版本是不一致的。所以我们可以对每个项目有专属于它的环境。所以这个文章就是教你如何创建新环境。 一、创建新环境 首先我们需要去官网下载conda。然后在Pycharm下面添加conda的可执行文件。 用conda创建新环境。 二、…

libmosquitto库的一个bug,任务消息id(mid)分配后不起作用

代码如图所示: 当订阅了所有主题后,每个主题的mid是他们的下标索引加100的数字,可是实际打印出来的值是: mid依然是1,2,这个参数在这里失效了,不知道是bug还是mqtt的什么机制?

Python之Pygame游戏编程详解

一、介绍 1.1 定义 Pygame是一种流行的Python游戏开发库,它提供了许多功能,使开发人员可以轻松创建2D游戏。它具有良好的跨平台支持,可以在多个操作系统上运行,例如Windows,MacOS和Linux。在本文中,我们将…

Linux后台运行Python的py文件,如何使ssh工具退出后仍能运行

常规运行 python3 mysqlbak.py ssh工具退出后,或ctrlc中断后,程序将不在运行 后台运行 nohup python3 mysqlbak.py > mysqlbak.log & > mysqlbak.log为可选项,输出日志到指定文件,如果不写,输出日志到nohup…

【Seata源码学习 】篇四 TM事务管理器是如何开启全局事务

TM发送 单个或批量 消息 以发送GlobalBeginRequest消息为例 TM在执行拦截器链路前将向TC发送GlobalBeginRequest 消息 io.seata.tm.api.DefaultGlobalTransaction#begin(int, java.lang.String) Overridepublic String begin(String applicationId, String transactionServi…

网络安全工程师究竟是什么?怎么入门?

首先啊骚年们我们必须先了解网络安全这个行业究竟是干啥的。 是打ctf的?一个个都像韩商言吴白那么帅刷刷敲几个代码就能轻易夺旗? 还是像十大黑客之一的米特尼克一样闯入了“北美空中防务指挥系统”的计算机主机内,还在被通缉逃跑期间控制了…

鸿蒙原生应用/元服务开发-AGC分发如何上架HarmonyOS应用

一、上架整体流程 二、上架HarmonyOS应用 获取到HarmonyOS应用软件包后,开发者可将应用提交至AGC申请上架。上架成功后,用户即可在华为应用市场搜索获取开发者的HarmonyOS应用。 配置应用信息 1.登录AppGallery Connect,选择“我的应用”。…

最重要的BI测试-适用于任何BI和分析平台

为什么 BI 测试是答案 相信你的数据可视化是成功执行商业智能 (BI) 和分析项目的关键因素。我敢肯定,你遇到过以下情况:业务主管或业务用户反馈说他们的分析看起来不对,他们的 KPI 看起来有问题,或者速度太慢而无法使用。要问自己…

Spring框架学习 -- Bean的生命周期和作用域

目录 前言 案例 案例分析 作用域的定义 Bean对象的6种作用域 Singleton prototype 设置作用域 ​编辑延迟初始化 Spring的执行流程 Bean的生命周期 前言 我们可以类比一下普通变量的生命周期和作用域, 大多数变量的生命周期和作用域都被限定在了花括号内 {}, 除…

贝锐花生壳:无需公网IP、简单3步,远程访问群晖NAS

面对NAS远程访问难题,贝锐花生壳一招搞定!并且无需公网IP、简单3步,即可实现固定域名远程访问NAS。 步骤1: 目前,群晖NAS已在套件中心内置花生壳客户端。 浏览器进入群晖NAS的DSM管理界面,点击【套件中心】…

SSM大学生社团信息管理系统-99953,(免费领取源码)计算机毕业设计选题开题+程序定制+论文书写+答辩ppt书写 包售后 全流程

SSM大学生社团信息管理系统APP 摘 要 随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,高校当然也不能排除在外。大学生社团信息管理系统APP是以实际运用为开发背景&#xff0c…

[Python程序打包: 使用PyInstaller制作单文件exe以及打包GUI程序详解]

文章目录 概要Python 程序打包—使用 Pyinstaller 打包 exePython程序打包—使用Pyinstaller打包GUI程序Python程序打包—使用 Pyinstaller 设置 exe 图标小结 概要 使用PyInstaller工具将Python程序打包成可执行(EXE)文件。将Python程序打包成EXE的好处…

unittest指南——不拼花哨,只拼实用

📢专注于分享软件测试干货内容,欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!📢交流讨论:欢迎加入我们一起学习!📢资源分享:耗时200小时精选的「软件测试」资…

看完就会,从抓包到接口测试的全过程解析【1500字保姆级教程】

一、为什么抓包 1、从功能测试角度 通过抓包查看隐藏字段 Web 表单中会有很多隐藏的字段,这些隐藏字段一般都有一些特殊的用途,比如收集用户的数据,预防 CRSF 攻击,防网络爬虫,以及一些其他用途。这些隐藏字段在界面…

从裸机启动开始运行一个C++程序(十四)

前序文章请看: 从裸机启动开始运行一个C程序(十三) 从裸机启动开始运行一个C程序(十二) 从裸机启动开始运行一个C程序(十一) 从裸机启动开始运行一个C程序(十) 从裸机启动…

socket can中是如何根据 结构体can_bittiming_const中的字段 计算bitrate的?

在 SocketCAN 中,can_bittiming_const 结构体用于表示 CAN 总线的定时参数,包括位率(bitrate)的计算。can_bittiming_const 包含了许多与位率相关的参数,其中一些参数用于计算实际的位率。 下面是一些与位率计算相关的…

js实现数组的上下移动

思路:上移表示index索引位置减去1,下移表示index索引位置增加1。使用数组的splice方法实现。例如上移:splice(元素当前索引位置,1(删除1个元素),‘元素当前索引位置 - 1’)。
最新文章