2023.04.23 学习周报

文章目录

  • 摘要
  • 文献阅读
    • 1.题目
    • 2.摘要
    • 3.介绍
    • 4.模型
      • 4.1 研究区域
      • 4.2 自相关分析
      • 4.3 LSTM
    • 5.实验与讨论
      • 5.1 高架道路不同位置空气污染物的变化
      • 5.2 高架道路不同位置空气污染物的相关性
      • 5.3 高架道路不同位置空气污染物预测
    • 6.结论
    • 7.展望
  • 度规张量
    • 1.曲率
    • 2.度量张量
    • 3.代码实现
    • 4.平行四边形法则
    • 5.定义坐标系
  • 度规张量与神经网络的联系
    • 1.本质
    • 2.想法
  • 总结


摘要

This week, I read a computer science that looked at the environmental impact of traffic pollutants on Shanghai’s roads. The effects of NO, NO2, CO and O3 were quantified using two years of observation data from roadside air quality monitoring stations in Shanghai. Therefore, this paper uses autocorrelation analysis to identify the periodic pattern of air pollutants. The results show that the traffic pollution under the elevated road is more serious, and the daily periodicity of air pollutants is more significant. Therefore, the paper proposes a new long-term memory model to predict air quality, which has higher match and lower prediction error compared with other baseline models. In addition, I learn about metric tensor, understand the nature of metric tensor, and thought about how to connect metric tensor with neural networks.

本周,我阅读了一篇旨在研究上海道路上的交通污染物对环境影响的文章。文章使用了上海路边空气质量监测站的两年观测数据,量化了NO、NO2、CO和O3的影响。于是,文章采用自相关分析方法去识别大气污染物的周期性模式。结果表明,高架道路下的交通污染更为严重,空气污染物的日周期性特征更为显著。因此,文章提出了一种新的长时间记忆模型来预测空气质量,该模型与其他基线模型相比,具有更高的匹配性和更低的预测误差。此外,我学习了度规张量的相关内容,理解了度量张量的本质,以及思考怎么将度规张量与神经网络联系起来。


文献阅读

1.题目

文献链接:Prediction of air pollutants on roadside of the elevated roads with combination of pollutants periodicity and deep learning method

2.摘要

The socio-economic effects of urban elevated roads have been well-documented in previous studies. Nevertheless, the environmental impacts of the elevated road location are rarely considered. In this study, we quantified such impacts on four traffic pollutants (e.g., NO, NO2, CO, and O3) in Shanghai, using the two-year observation data from Shanghai roadside air quality monitoring stations—under the elevated road and on the side of the elevated road. Auto-correlation analysis was employed to identify the periodic patterns of air pollutants. The results showed that the severer traffic pollution and more notable daily periodic characteristics of air pollutants were observed under the elevated road. This result may be attributed to the elevated “cap” structure, which has become a barrier to prevent the pollutant diffusion in street canyon. Further, a novel Long Short-Term Memory model with the identified periodicity was proposed to predict air quality. The proposed model achieved higher goodness of fit and lower prediction error in prediction of four pollutants compared to other baseline models, and that the forecasting accuracy was higher under the elevated road. These findings ascertain the effect of the elevated road location on the variations of atmospheric pollutants and could provide implications in taking control measures to mitigate traffic pollution under the elevated road.

3.介绍

1)在社会经济和城市化革命的推动下,对城市内和城市间交通的需求不断增加。
2)为了适应交通运输的需要,提高城市路网的承载能力,许多特大城市广泛修建城市高架道路,以延伸城市内外的联系。
3)由于密集的交通流量、街道峡谷和风场的共同作用,这些建筑物会加剧了当地的大气污染,特别是行人和居民区。
4)以往的现场测量研究主要描述了空气污染物在距离感兴趣位置不同距离处的水平分布,于是在一条繁忙的高速公路附近进行了这样的尝试。
5)将识别出的周期性结合LSTM模型的深度学习方法中进行预测。

4.模型

4.1 研究区域

研究区域位置:
在这里插入图片描述
研究区域具体信息:
在这里插入图片描述
1)为了解和明确高架道路周边交通污染特征,采集了2018-2019年上海市XHCX和JAGH两个路边空气质量监测站的环境污染物(NO、NO2、NOx、CO、PM2.5、PM10、SO2和O3)数据。
2)两者的区别是XHCX站位于高架道路下方,而JAGH站位于高架道路一侧。选择这两个站点的数据是为了揭示高架道路位置对环境空气质量的影响。

4.2 自相关分析

ACF 是一种识别时间序列中隐含的周期行为的有效技术。其目的是研究测量变量 s 的时间序列,并计算皮尔逊相关系数作为时间滞后 τ 的函数:
在这里插入图片描述

4.3 LSTM

LSTM 模型面临一个潜在的问题,即需要提前确定时间间隔。为了解决 LSTM 方法的不足,利用自相关分析来确定空气污染物的最佳时间间隔。模型框架如下所示:
在这里插入图片描述
1)O3 为上海市主要污染物,NO、NO2、CO 表示为与交通排放密切相关的其他污染物。
2)输入序列可以看作是两个不同序列的集成,分别为目标污染物数据的历史数据和其他污染物数据。
3)通过两个常用的评价参数来评价该算法的预测性能,即决定系数和均方根误差。其中较高的 r2 和较低的 RMSE 值与较好的模型性能相关,计算公式如下:
在这里插入图片描述

5.实验与讨论

5.1 高架道路不同位置空气污染物的变化

1)两个监测站的交通流量每日变化情况:
在这里插入图片描述
2)两个监测站空气污染物的日变化:
在这里插入图片描述
结果表明,高架道路已成为阻止污染物在街峡谷扩散的屏障,并且XHCX站的交通污染比JAGH站严重。
3)两个监测站空气污染物的自相关分析:
在这里插入图片描述
结果表明,在空气质量预测模型中加入污染物的日周期性特征,可以获得更高的预测精度。

5.2 高架道路不同位置空气污染物的相关性

XHCX 和 JAGH 站 2018-2019 年空气污染物的斯皮尔曼相关系数:
在这里插入图片描述
实验数据表明,XHCX 站污染物间的 Spearman 秩相关系数显著高于 JAGH 站,这也说明高架结构阻止了污染物扩散,使两者之间的相关性增强。

5.3 高架道路不同位置空气污染物预测

将具有日周期性的LSTM模型与基线模型的结果进行比较:
在这里插入图片描述
结果表明,具有日周期性的LSTM模型能够捕捉到时间序列数据中的时间依赖性,提高了预测NO、NO2、CO和O3的准确性。因此,该方法可用于预测不同空气污染物的浓度。

6.结论

1)高架路下部NO、NO2、CO、O3浓度均高于高架路侧边,特别是白天尤其明显。因此,现象表明高架道路已成为阻挡街道峡谷污染物扩散的屏障。
2)两个地点的NO、NO2、CO、O3变化均呈日周期性变化,且高架路下的周期性特征较高架路侧更为明显。
3)高架路面下污染物的Spearman秩相关系数比高架路面侧污染物的Spearman秩相关系数更显著,说明高架结构阻止了污染物的扩散,使两者的相关性更强。
4)深度学习模型结合周期特征,提高预测精度。与传统的空气质量预测模型相比,具有周期特征的LSTM深度学习模型具有更高的预测精度。
5)与高架道路侧相比,提出的具有日周期性的LSTM模型在高架道路下的性能更好。因此,这说明了空气污染物变化的周期性特征有利于城市空气质量的预测。

7.展望

研究的局限性在于数据集仅包括上海市的两个空气监测站,然而更广泛的目标区域可以提供更准确的结果和更深入的见解。因此,作者提到未来的研究会考虑更多车站的数据,以进一步揭示高架道路位置对空气污染物的影响。

度规张量

1.曲率

对于一些二维面,比如平面是“平”的,球面是“弯曲”的,这种对二维面的曲直的直观判断,其实借用了三维视角。我们总认为这些面是嵌入在一个平直的三维空间中的,而所谓“平直”,是指这个三维空间有一些几何规则:两点之间直线最短、三角形内角和是180度、勾股定理等。这样的空间就是欧几里得空间,

怎么判断某个面是弯曲的?人们可以根据直觉给出答案:因为这个面的面外法矢量并不是处处相等,即矢量的方向不同;或者说存在一条与这个面有两个以上交点,但不在这个面内的直线段。这两种说法借用了曲面外的第三个维度,这种从更高维度空间观察到的曲率称为外曲率。

如果不借助任何面外的矢量,又怎么去判断曲直呢?假如有一个生活在球面上的二维生物,它无法感知到球面以外的第三个维度,那么它怎么知道自己的世界是弯曲的呢?在球面上,两点之间最短的距离是一段大圆弧,在二维生物眼中,是一条直线段。如果以北极点、赤道上东经 0 度和赤道上东经 90 度三个点为顶点,以大圆弧为边,作一个三角形,那么这个三角形的内角之和是 270 度,这显然不符合欧氏空间中三角形的性质。因此,这个二维世界是弯曲的。

2.度量张量

什么是度量张量?度量张量就是用来把斜角坐标的读数转换成直角坐标读数,度量张量的本质就是坐标变换,是向量在任意坐标系的读数对自己点乘的算式结果中的基向量的那一部分。

举例说明,以g1,g2为基向量的斜角坐标系为例,其中g1,g2的直角坐标系读数分别是:在这里插入图片描述
这就是坐标变换矩阵,这个矩阵负责将一个矢量在任意坐标系中的读数,转换为其对偶坐标系中的读数。具体来说,根据线性代数中坐标变换的原理,这个矩阵的元素是任意坐标系的基矢量在其对偶坐标系中的读数。在这个坐标系中,求长度的公式为:
在这里插入图片描述
于是,它的度量张量就是:
在这里插入图片描述

3.代码实现

理解度规张量,就是去理解坐标变换,即为什么一个向量左乘一个矩阵,等于将这个向量变形到这个变形坐标系,或者说将斜角坐标的读数转换成直角坐标读数的解释。
在这里插入图片描述
python验证:

import numpy as np

g1 = np.array([1.5, 0.5])
g2 = np.array([1, 2])

G = np.array([[1.5, 1],
              [0.5, 2]])

# 列是斜角坐标系的两个基向量直角坐标读数
print("斜角坐标系到直角坐标系的变换矩阵\n", G)

# @运算符:矩阵乘法, 还可以表示A投影到B
metrics = np.array([[g1 @ g1, g1 @ g2],
                   [g2 @ g1, g2 @ g2]])
print("度量张量的第一种求法:基向量点乘\n", metrics)

metricsTensor = G.T @ G
print("度量张量的第二种求法:G的转置矩阵乘以G\n", metricsTensor)
print("G的转置\n", G.T)

Va = np.array([1, 1])
print("向量V的斜角坐标读数Va\n", Va)

# 已知斜角读数和转换矩阵G,求迪卡尔读数Ve,需要用G@Va, 或者Va@G.T, 不能用Va@G
Ve = G @ Va
print("迪卡尔读数Ve\n", G @ Va, Va @ G.T, Va @ G)

Vb = metricsTensor @ Va
print("向量V的对偶坐标读数Vb=metricsTensor@Va\n", Vb)

print("------------------------------\n")
print("度规张量的最原始解释, 其实就是将向量的斜角坐标转换成直角坐标再运算,"
      "(Va @ G.T) @ (G @ Va)\n",
      (Va @ G.T) @ (G @ Va))
print("------------------------------\n")
print("直角坐标点乘Ve@Ve\n", Ve @ Ve)
print("对偶点乘Vb@Va,Va@Vb\n", Vb @ Va, Va @ Vb)
print("用度量张量求长度\n", Va @ metricsTensor @ Va)

输出:

斜角坐标系到直角坐标系的变换矩阵
 [[1.5 1. ]
 [0.5 2. ]]
度量张量的第一种求法:基向量点乘
 [[2.5 2.5]
 [2.5 5. ]]
度量张量的第二种求法:G的转置矩阵乘以G
 [[2.5 2.5]
 [2.5 5. ]]
G的转置
 [[1.5 0.5]
 [1.  2. ]]
向量V的斜角坐标读数Va
 [1 1]
已知斜角读数和转换矩阵G,求迪卡尔读数Ve,需要用G@Va, 或者Va@G.T, 用Va@G是不可以的
 [2.5 2.5] [2.5 2.5] [2. 3.]
向量V的对偶坐标读数Vb=metricsTensor@Va
 [5.  7.5]
------------------------------

度规张量的最原始解释, 其实就是将向量的斜角坐标转换成直角坐标再运算,(Va @ G.T) @ (G @ Va)
 12.5
------------------------------

直角坐标点乘Ve@Ve
 12.5
对偶点乘Vb@Va,Va@Vb
 12.5 12.5
用度量张量求长度
 12.5

4.平行四边形法则

1)一个合力和两个分力之间的关系,可以用平行四边形原则分解。其实这个规则具有普遍性,因此力是一种矢量,速度也是一种矢量,而不同的矢量也同样遵循平行四边形法则。
2)在平行四边形法则中,两个基矢量构成的平行四边形对角线的长度,可以作为一个基本度量,可以用它来衡量其他矢量的强度。两个分量的不同,又能定义其他矢量的方向。其中:投影矩形是平行四边形的特例。
3)一个力有无数种分解方法,矩形也是其中一种,甚至矩形分解也有很多种。如果已知一个基矢量,那么另一个基矢量都仍然有很多种选法。其中:另一个基矢量如果大小确定,调整它的方向,会导致两个坐标轴上的分量的变化;而方向确定,调整它的大小,也会导致两个分量的变化。

5.定义坐标系

在这里插入图片描述
1)任意两个尾部相连的向量,不一定垂直就可以定义一个坐标系。任何其他向量,都可以表示为这两个向量的和。
2)我们习惯了笛卡尔带来的直角坐标系,将一个矢量分解为 x, y,这会给我们带来误解。其实在坐标系中,一个矢量是对基矢量进行分解的,而不是两个数。在所有坐标系中,其实都是 x dot g1,y dot g2这种形式。只是在直角坐标系中比较特殊,我们很少带着基向量。
3)在斜角坐标系中,想要表示一个向量,需要使用平行四边形分解法则。但是怎么得到任意向量在g1,g2上面的分量呢?

度规张量与神经网络的联系

1.本质

度规张量是描述时空中曲面的几何结构的量。在广义相对论中,时空不再是平直的,而是被质量和能量所影响而弯曲,度规张量描述了时空的曲率和间距。而度规张量的本质是一种张量,它是一个数据集合,包含了时空的某种几何性质的数值。它可以用来计算两个点之间的距离、角度、面积和体积等量。

2.想法

1)第一个想法,可以将度规张量视为神经网络的权重。神经网络中的权重控制着模型如何处理输入,度规张量控制着相对论中的物理模型如何处理时空结构。我们可以使用神经网络来学习如何调节度规张量,以便更好地捕捉时空的结构和物理学中的现象。
2)第二个想法,可以将度规张量与神经网络中的梯度联系起来。因为梯度通常被用来确定神经网络中的权重,以最小化模型的损失函数。类似地,度规张量可以用来确定物理模型中的粒子或场的轨道或运动方式,以最小化相对论中的作用量。


总结

本周,我主要学习了度规张量,在学习的过程中,我了解到度量张量是一个坐标变换矩阵,它的作用是将一个矢量在任意坐标系中的读数,转换为其对偶坐标系中的读数。这个内容还是比较容易理解,但是什么是度规,以及在斜角坐标系中,怎样通过平行四边形分解法则得到任意向量在基矢量上的分量还没有理解清楚。下周,我将继续深入理解度规张量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/14559.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【go】三色标记-垃圾回收机制

垃圾回收原因 : 垃圾回收是一种内存管理技术,它的主要目的是自动管理程序中的内存分配和释放,以减少内存泄漏和野指针等问题 赋值器与回收器: 赋值器(Mutator)是指程序中的执行部分,负责创建…

LinkedBlockingQueue原理

1. 基本的入队出队 public class LinkedBlockingQueue<E> extends AbstractQueue<E>implements BlockingQueue<E>, java.io.Serializable {static class Node<E> {E item;/*** 下列三种情况之一* - 真正的后继节点* - 自己, 发生在出队时* - null, 表…

Django框架之创建项目、应用并配置数据库

django3.0框架创建项目、应用并配置数据库 创建项目 进入命令行 新建一个全英文的目录 进入目录 输入命令 django-admin startproject project 项目目录层级 查看当前目录层级 tree /f 目录文件说明 创建数据库 做一个学生管理系统做演示&#xff0c;使用navicat创建数据…

windows中vscode配置C/C++环境

首先要把MinGW的环境安装完&#xff0c;我一般是下载带有MinGW的codeblocks&#xff0c;这样省去自己安装MinGW。因为安装MinGW还挺麻烦的。 安装完codeblocks&#xff0c;找到其安装目录&#xff0c;把bin文件配置到环境变量去&#xff1a; 将bin添加到环境变量 然后打开vsco…

[读书笔记] 从问题和公式角度理解 Diffusion Model

[小全读书笔记] 从问题和公式角度理解 Diffusion Model 1. Diffusion Model的结构1.1 定义与限制1.2 定义与限制的数学体现 2. Diffusion Model的模型训练2.1 似然函数转换成ELBO2.2 拆解ELBO2.3 求解关键&#xff1a; q ( x t − 1 ∣ x t , x 0 ) q(x_{t-1}|x_t,x_0) q(xt−1…

【c语言】函数的数据传递原理 | 数组传入函数方法

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; 给大家跳段街舞感谢支持&#xff01;ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ…

ChatGPT实现语义分析情感分类

语义分析情感分类 我们从开源社区找到了中科院谭松波博士整理的携程网酒店评论数据集(https://raw.githubusercontent.com/SophonPlus/ChineseNlpCorpus/master/datasets/ChnSentiCorp_htl_all/ChnSentiCorp_htl_all.csv)。一共七千余条数据&#xff0c;包括 label 和 review …

5G基站外市电改造建设方案 (ppt可编辑)

本资料来源公开网络&#xff0c;仅供个人学习&#xff0c;请勿商用&#xff0c;如有侵权请联系删除 外市电定义及分类 定义&#xff1a;由供电部门提供的专用高压电源或非专用高压电源或低压电源均称为市电。分类&#xff1a; &#xff08;1&#xff09;按电压等级分类 ①提供…

Linux Shell 实现一键部署http+用户名密码登录

Apache 前言 Apache(音译为阿帕奇)是世界使用排名第一的Web服务器软件。它可以运行在几乎所有广泛使用的计算机平台上&#xff0c;由于其跨平台和安全性被广泛使用&#xff0c;是最流行的Web服务器端软件之一。它快速、可靠并且可通过简单的API扩充&#xff0c;将Perl/Python等…

西交大-一百本书-解决不能粘贴的限制

快毕业了&#xff0c;要填四个一百&#xff0c;其他三个都几分钟就填完了。只有读一百本书要写读书笔记且不能粘贴&#xff0c;防谁呢真是的。发现一种解决不能粘贴限制的方法。顺道附上利用ChatGpt快速生成书评的方法。 四个一百网址 一、 解除粘贴限制 以edge浏览器为例 登…

Redis基础知识概述

Redis基础知识概述 文章目录 Redis基础知识概述一、Redis简介二、NoSQL技术三、Redis的高并发和快速原因四、Redis为什么是单线程的 五、单线程的优劣势1、优势2、劣势 六、Redis高并发总结七、在java中使用Redis1、添加Jedis依赖 八、Redis在Java Web中的应用1、存储缓存用的数…

C++的异常

文章目录 1. C语言传统的处理错误的方式2. C异常概念3. 异常的使用3.1 异常的抛出和匹配原则 4. C标准库的异常体系5. 自定义异常体系6. 异常的重新抛出7. 函数调用链中异常栈展开匹配原则8. 异常安全9. 异常规范10. 异常的优缺点 1. C语言传统的处理错误的方式 传统的错误处理…

【LPC55s69】使用FAL分区管理与easyflash变量管理

文章目录 1.FAL组件1.1什么是FAL1.2 使用ENV配置FAL1.3 FAL SFUD 移植1.4 FAL SFUD 测试用例1.5 测试结果 2.DFS文件系统2.1 什么是DFS2.2 DFS架构2.3 使用ENV配置DFS2.4 DFS挂载到FAL分区测试2.5 测试结果 3.Easyflash移植到FAL分区3.1 简述EasyFlash3.2EasyFlash软件包使用3.…

windows 文件夹目录过长超过长度259字符 文件打不开

当路径超过260个字符时&#xff0c;Windows操作系统就无法处理文件或文件夹&#xff0c;并且无法打开或重命名。这是因为Windows系统使用的文件系统&#xff0c;即FAT和NTFS文件系统&#xff0c;都有最大路径限制。NTFS文件系统最大长度限制为32767个字符&#xff0c;但操作系统…

凝心聚力,携“源”出海:开源社顾问委员会2023年第一季度会议圆满举办!

2023 年 3 月 25 日&#xff0c;开源社顾问委员会&#xff08;以下简称"顾问委员会"&#xff09;第一季度会议在北京圆满召开。这是顾问委员会自 2018 年成立以来的第 17 次全体委员会议。 为增进顾问委员会成员交流&#xff0c;加强开源社社区建设&#xff0c;实现开…

ansible自动运维——ansible使用临时命令通过模块来执行任务

大家好&#xff0c;这里是天亮之前ict&#xff0c;本人网络工程大三在读小学生&#xff0c;拥有锐捷的ie和红帽的ce认证。每天更新一个linux进阶的小知识&#xff0c;希望能提高自己的技术的同时&#xff0c;也可以帮助到大家 另外其它专栏请关注&#xff1a; 锐捷数通实验&…

制冷暖通工业互联网平台建设

制冷暖通工业互联网平台建设需要遵循一定的流程&#xff0c;具体步骤如下&#xff1a; 需求分析&#xff1a;了解客户需求&#xff0c;包括业务流程、系统功能、界面设计等方面。 系统设计&#xff1a;基于需求分析&#xff0c;进行系统设计&#xff0c;包括系统结构、数据库设…

jekyll+GithubPage搭建一个免费的个人网站

文章目录 Jekyll环境搭建windows安装RUBY、gem、Jekyll用Jekyll搭建本地博客 用jekyll模板搭建githubpage Jekyll环境搭建 windows安装RUBY、gem、Jekyll 安装ruby RUBY安装包下载地址&#xff1a;https://rubyinstaller.org/downloads/&#xff0c;一路默认选项next即可。 最…

LightGBM

LightGBM LightGBM是XGBoost的优化。 提出算法的原因&#xff1a; GBDT在每一次迭代的时候&#xff0c;都需要遍历整个训练数据多次。如果把整个训练数据装进内存则会限制训练数据的大小&#xff1b;如果不装进内存&#xff0c;反复地读写训练数据又会消耗非常大的时间。尤其面…

python 第一章——简介与环境搭建

文章目录 前言一、什么是编程语言二、下载python解释器三、安装pycharm 前言 本系列教程目录可点击这里查看&#xff1a;python教程目录 python在当今世界的流行度应该已经不用我多说了&#xff0c;这可以从TIOBE的榜单中可窥一二 作为一门面向编程新人的语言&#xff0c;它…
最新文章