时间序列分析

常用数据集

在这里插入图片描述

2.monash数据集
官网链接
我们的存储库包含30个数据集,包括公开可用的时间序列数据集(不同格式)和由我们管理的数据集。

DatasetDomainNo: of SeriesMin. LengthMax. LengthCompetitionMultivariateDownloadSource
M1Multiple100115150YesNoYearly Quarterly Monthly YearlyAthanasopoulos et al., 2011
M3Multiple300320144YesNoQuarterly Monthly OtherMakridakis and Hibon, 2000
M4Multiple100000199933YesNoYearly Quarterly Monthly Weekly Daily HourlyMakridakis et al., 2020
TourismTourism131111333YesNoYearly Quarterly MonthlyAthanasopoulos et al., 2011
CIF 2016Banking7234120YesNoMonthlyStepnicka and Burda, 2017
London Smart MetersEnergy556028839648NoNoW Missing W/O MissingJean-Michel, 2019
Aus. Electricity DemandEnergy5230736232272NoNoHalf HourlyCurated by us
Wind FarmsEnergy3396345527040NoNoW Missing W/O MissingCurated by us
DominickSales11570428393NoNoWeeklyJames M. Kilts Center, 2020
BitcoinEconomic1826594581NoNoW Missing W/O MissingCurated by us
Pedestrian CountsTransport6657696424NoNoHourlyCity of Melbourne, 2020
Vehicle TripsTransport32970243NoNoW Missing W/O Missingfivethirtyeight, 2015
KDD Cup 2018Nature270950410920YesNoW Missing W/O MissingKDD Cup, 2018
WeatherNature3010133265981NoNoDailySparks et al., 2020
NN5Banking111791791YesYesDaily W Missing Daily W/O Missing WeeklyBen Taieb et al., 2012
Web TrafficWeb145063803803YesYesDaily W Missing Daily W/O Missing WeeklyGoogle, 2017
SolarEnergy1375256052560NoYes10 Minutes WeeklySolar, 2020
ElectricityEnergy3212630426304NoYesHourly WeeklyUCI, 2020
CarPartsSales26745151NoYesW Missing W/O Missing
FRED-MDEconomic107728728NoYesMonthlyMcCracken and Ng, 2016
San Francisco TrafficTransport8621754417544NoYesHourly WeeklyCaltrans, 2020
RideshareTransport2304541541NoYesW Missing W/O MissingCurated by us
HospitalHealth7678484NoYesMonthlyHyndman, 2015
COVID DeathsNature266212212NoYesDailyJohns Hopkins University, 2020
Temperature RainNature32072725725NoYesW Missing W/O MissingCurated by us
SunspotNature17393173931NoNoW Missing W/O MissingSunspot, 2015
Saugeen River FlowNature12374123741NoNoDailyMcLeod and Gweon, 2013
US BirthsNature173057305NoNoDailyPruim et al., 2020
Solar PowerEnergy173972227397222NoNo4 SecondsCurated by us
Wind PowerEnergy173971477397147NoNo4 SecondsCurated by us

常用指标

MSE(mean square error)均方误差
RMSE(root mean square error) 均方根误差
MAE(mean absolute error) 平均绝对误差
MAPE(mean absolute percentage error) 平均绝对百分比误差
SMAPE(Symmetric Mean Absolute Percentage Error) 对称平均绝对百分比误差

对比:先对比有平方操作和没有平方操作的,平方操作会放大单个点的误差,对误差的惩罚更大,因此有平方操作的对异常点更加明显,没有平方的操作对所有误差一视同仁,对异常点不敏感。

MSE和RMSE: RMSE 的值可以更直观地解释为与目标变量相同单位的标准差。这使得 RMSE 更容易理解,因为它具有与数据相同的度量单位。

SMAPE vs MAPE:SMAPE 在处理分母为零的情况时更稳健,因为分母考虑了真实值与预测值的绝对值的和。

MAE vs MAPE:MAE: MAE 的单位与原始数据的单位相同,因为它是误差的平均绝对值。
MAPE: MAPE 的结果是以百分比形式表示的,不受原始数据单位的影响。它以百分比来度量相对误差。

均方误差(Mean Absolute Error,MAE)和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)在不同的应用场景中可能更适用,取决于对误差度量的不同关注点。以下是它们适用场景的一些特点:

MAE 的适用场景:

误差大小关键: 当关注模型预测的绝对误差的大小时,MAE 是一个合适的选择。它直接度量了预测误差的平均绝对值,对于业务问题中误差的实际大小提供了直观的度量。

MAPE 的适用场景:

相对误差关键: 当关注模型预测的相对误差的大小时,MAPE 是更合适的选择。它将每个样本的绝对误差与相应的真实值的百分比进行比较,更强调相对误差的百分比。

数据具有不同尺度: MAPE 在处理具有不同尺度的数据时可能更为合适,因为它以百分比形式提供了一个相对的度量,不受原始数据单位的影响。MAPE因此可以适用于不同数据集之间的比较。

常用方法

统计方法
机器学习方法
深度学习方法
基于transformer的方法
基于预训练大模型的方法

实验设计

1.不同时间序列任务:预测、分类、异常检测
2.不同类型任务:监督、自监督、迁移
3.数据集:zero-shot,one-shot,all
4.变量:多预测多,多预测单、单预测单、部分变量预测
5.训练方法:fine-tuning, linear probing, and supervising from scratch
6.消融实验:w/o replace 超参数
LookbackWindow(seq_len)
pred_len
patch_len
patch_num
关于超参数的实验往往使用图来展示
7.指标:性能相关:mse、mae;效率:时间;体量:参数量

实验分析

CKA相似度
SHAP
除了SHAP之外,还有一些其他用于解释机器学习模型的方法。这些方法各有特点,适用于不同类型的模型和任务。以下是一些常见的模型解释方法:

1.LIME(Local Interpretable Model-agnostic Explanations): LIME是一种模型无关的局部解释方法,它通过在局部生成一个简单的可解释模型来解释黑盒模型的预测。LIME通过在输入空间中生成随机样本,观察它们的模型输出,然后拟合一个简单的解释模型,以近似原始模型在该点的行为。
2.Feature Importance(特征重要性): 这是一种简单但常用的解释方法,通过分析模型中各个特征对于输出的相对重要性。随机森林、决策树等模型通常提供特征重要性的直接输出。
3.Partial Dependence Plots(偏依赖图): 偏依赖图显示模型输出与某个特征之间的关系,保持其他特征不变。通过观察这些图表,可以了解模型是如何对单个特征进行响应的。
4.Shapley Regression Values(SRV): 类似于SHAP值,SRV是一种基于博弈论的解释方法,用于解释回归模型的预测。它提供了每个特征对于整体预测的贡献。
5.TreeInterpreter: 针对树模型(如决策树和随机森林),TreeInterpreter可以解释单个预测是如何通过模型的各个树来形成的。
6.LASSO Regression: 在线性回归中,使用LASSO(Least Absolute Shrinkage and Selection Operator)进行特征选择,可以得到一个稀疏模型,从而识别对输出有重要贡献的特征。
7.Global Surrogate Models: 这是一种通过在原始模型周围训练一个可解释的替代模型来解释复杂模型的方法。例如,用一个简单的线性模型来近似复杂的深度学习模型。

选择合适的解释方法取决于具体的问题、模型和数据。通常,结合多种解释方法可以提供更全面的理解。值得注意的是,不同的解释方法对于不同类型的模型和任务可能具有不同的适用性和可解释性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/262816.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

配置MUX VLAN示例(接入层设备)

一、组网需求 在企业网络中,企业所有员工都可以访问企业的服务器。但对于企业来说,希望企业内部部分员工之间可以互相交流,而部分员工之间是隔离的,不能够互相访问。为了解决上述问题,可在连接终端的交换机上部署MUX …

keil 5 : Error: L6218E: Undefined symbol 问题解决方法小记

1.路径已添加但依旧包找不到定义的错误,这里找不到的是DFP包中的函数 2.点击Manage Run-Time Environment->打开Device->ATC Driver->勾选SPI(找到你未定义函数所在的DFP包中的模块) 3.编译后,点击Open definition会成功跳转到函数…

ansible的脚本------playbook剧本

playbook组成部分: 1.task 任务:包含要在目标主机上执行的操作,使用模块定义这些操作。每个都是一个模块的调用。2.variables 变量:存储和传递数据。变量可以自定义,可以在playbook当中定义为全局变量,也可…

用C爬取人人文库并分析实现免积分下载资料

最近有个学妹学习遇到问题,想要的学习资料都在文库中,因为资料太多太杂,想要一篇篇找太难了,主要是太浪费精力了。因此,听说这个事情我能解决,立马找到我,给我一杯奶茶就把我收买了,…

4. 可用性

文章目录 4. 第4章 可用性4.1. 可用性一般场景4.2. 可用性策略故障检测(Detect Faults)故障恢复(Recover from Faults )故障预防(Prevent Faults) 4.3. 基于策略的可用性调查表4.4. 可用性模式4.5. 扩展阅读…

云渲染Blender怎么用 Blender云渲染设置教程

作为一个免费且开源的三维创作套件,Blender为独立艺术家和小规模的创意团队提供了一个功能丰富的平台,涵盖了从建模、雕刻到动力学模拟、动画和高级渲染的全套工作流程。随着其支持的特效和视觉质量的不断提升,Blender项目的渲染耗时也显著增…

智能变电站集中监控辅助决策系统解决方案

项目背景 智能变电站是坚强智能电网的重要基础和支撑。它不仅是电网运行数据的采集源头和命令执行单元,而且与其他环节的联系非常紧密,为统一坚强智能电网的安全和优质提供了关键支撑。为了更有效地管理和控制变电站的各种设备和子系统,如视…

防火墙安全策略

目录 一、防火墙种类 二、防火墙流量控制手段 1、包过滤技术(传统) 2、状态检测技术 (1)、状态检测机制 三、安全实验 1、拓扑 2、需求 3、配置思路 4、关键配置截图 5、验证 一、防火墙种类 对于防火墙来说就是针对哪…

嵌入式开发工程师

嵌入式开发 岗位需求 上岗必备 文章目录 嵌入式开发前言一、负责新产品的电路图、PCB、嵌入式程序、软硬件调试等工作二、负责对现有产品进行硬件优化、调试、维护、排故等工作三、 负责各种单片机,传感器,元器件选型以及BOM表整理四、 负责硬件产品研发和量产过程中项目设计…

某马头条——day01

项目相关 技术栈 课程大纲 跟着视频搭建环境即可 APP登录 需求分析 手动加盐加密 表中有一个字段是salt,盐值。 用户微服务搭建 在service模块下新建一个user模块 进行配置。 server:port: 51801 spring:application:name: leadnews-usercloud:nacos:discovery:…

亚洲诚信TrustAsia成功入选《第十四批上海市重点商标保护名录》

近日,为进一步加大注册商标专用权的保护力度,上海市知识产权局制定并发布了《第十四批上海市重点商标保护名录》,亚数信息科技(上海)有限公司(以下简称亚数)榜上有名,注册商标“亚洲…

Go语言与HTTP/2协议的实践探索

随着互联网技术的发展,HTTP/2协议逐渐成为主流。Go语言作为一种高效、简洁的编程语言,与HTTP/2协议的结合具有很大的潜力。本文将探讨Go语言与HTTP/2协议的实践探索。 一、HTTP/2协议的优势 HTTP/2协议相比HTTP/1.1协议,具有以下优势&#…

Flask解决接口跨域问题

1、什么是跨域CROS CORS(Cross-Origin Resource Sharing,跨域资源共享)是一种浏览器安全策略,用于控制在一个网页应用中如何让一个域的Web页面能够请求另一个域的资源。在Web开发中,由于同源策略(Same-Ori…

HarmonyOS快速入门之开发准备

开发准备 本文档适用于HarmonyOS应用开发的初学者。通过构建一个简单的具有页面跳转/返回功能的应用(如下图所示),快速了解工程目录的主要文件,熟悉HarmonyOS应用开发流程。 在开始之前,您需要了解有关HarmonyOS应用的…

docker安装ES:7.8和Kibana:7.8

本文适用于centos7,快速入手练习es语法 前置:安装docker教程docker、docker-component安装-CSDN博客 1.安装es 9200为启动端口,9300为集群端口 docker pull elasticsearch:7.8.0mkdir -p /mydata/elasticsearch/pluginsmkdir -p /mydata/elasticsear…

企业招股书API,轻松获取公司招股书信息

前言 随着互联网的普及和信息技术的不断发展,获取公司招股书信息变得越来越便捷。企业招股书API作为一种新型的技术手段,为投资者提供了更加高效、准确、全面的招股书信息。本文将介绍企业招股书API的功能和优势,帮助投资者轻松获取公司招股…

C++之深拷贝和浅拷贝

目录 浅拷贝 深拷贝 赋值运算符重载的深拷贝 在学习C类和对象时我们学习了浅拷贝,本期我们将再次回顾浅拷贝并为大家讲述深拷贝的概念。 浅拷贝 在学习类和对象时我们学习了拷贝构造函数的概念,而且我们也知道,因为拷贝构造函数属于类的默…

超好用的API协作管理工具:Apipost

在当今快速发展的数字化时代,API已成为企业与开发者实现数据互通、应用集成的重要桥梁。然而,随着API数量的不断增加,API开发、调试、测试、文档等工作也变得越来越复杂。为了解决这一痛点,一款名为Apipost的API协同研发工具应运而…

B/S医院手术麻醉临床管理系统源码 手术申请、手术安排

手术麻醉系统概述 手术室是医院各个科室工作交叉汇集的一个重要中心,在时间、空间、设备、药物、材料、人员调配的科学管理、高效运作、安全质控、绩效考核,都十分重要。手术麻醉管理系统(Operation Anesthesia Management System&#xff0…

陶建辉在 CIAS 2023 谈“新能源汽车的数字化”

近年,中国的新能源汽车发展迅猛,在全球竞争中表现出色,已经连续 8 年保持全球销量第一。在新兴技术的推动下,新能源汽车的数字化转型也正在加速进行,从汽车制造到能源利用、人机交互,各个环节都在进行数字化…