【深度学习】S2 数学基础 P1 线性代数(上)

目录

  • 基本数学对象
    • 标量与变量
    • 向量
    • 矩阵
    • 张量
    • 降维求和
    • 非降维求和
    • 累计求和
  • 点积与向量积
    • 点积
    • 矩阵-向量积
    • 矩阵-矩阵乘法

深度学习的三大数学基础 —— 线性代数、微积分、概率论;
自本篇博文以下几遍博文,将对这三大数学基础进行重点提炼。

本节博文将介绍线性代数知识,为线性代数第一部分。包含基本数学对象、算数和运算,并用数学符号和相应的张量代码实现表示它们。


基本数学对象

基本数学对象包含:

  • 0维:标量与变量
  • 1维:向量
  • 2维:矩阵

标量与变量

一个简单的温度转换计算表达式,
c = 5 9 ( f − 52 ) c = \frac 5 9 (f-52) c=95(f52)

其中 c 代表摄氏度,而 f 代表华氏度。
而这个计算表达式中,数值 5、9、52 是标量值,而未知的标量值,即自变量 f 与因变量 c,都是变量值。

标量与变量在张量中,由只有一个元素的张量来表示。

import torch
# 实例化两个标量
x = torch.tensor(3.0)
y = torch.tensor(2.0)

# 执行算数运算
print("x+y=", x+y, "\nx*y=", x*y, '\nx/y=', x/y, '\nx**y=', x**y)
x+y= tensor(5.) 
x*y= tensor(6.) 
x/y= tensor(1.5000) 
x**y= tensor(9.)

P.S. 在线性代数中,标量与变量通常用小写不加粗的字母表示, a a a


向量

向量可以视为由一系列标量值组成的列表,这些标量值被称为向量的元素或者分量。当使用向量来表示数据集中的样本时,它们通常具有一定的现实意义。例如一个用于表征用户个人信息的样本可以使用向量表示用户的年龄、性别、收入等标量信息。

使用张量表示向量,通常使用一维张量;

import torch

x = torch.arange(4)
print(x)
tensor([0, 1, 2, 3])

索引: 访问向量中的元素,可以直接通过索引值来访问;

print(x[-1])

长度: 所谓向量的长度,指的是向量中标量的个数,通过 len() 函数获取;

print(len(x))

形状: 通过 .shape 属性访问向量的形状。形状是一个元素组,列出张量沿每个轴的长度(维数)。而对于只有一个轴的张量,其形状只有一个元素。

print(x.shape)

P.S. 在线性代数中,向量通常使用粗体小写字母表示: a \mathbf{a} a


矩阵

正如向量是将标量从零阶推广到一阶,矩阵则是将向量从一阶推广到二阶。矩阵 A m n \mathbf{A_{mn}} Amn m m m n n n 列标量组成,其中每个元素 a i j a_{ij} aij 是矩阵中第 i i i j j j 列元素。

使用张量表示矩阵,使用二维张量;

import torch

x = torch.arange(20).reshape(5, 4)
print(x)
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11],
        [12, 13, 14, 15],
        [16, 17, 18, 19]])

索引: 访问矩阵中元素,通过行索引( i i i)和列索引( j j j)来访问矩阵中的标量元素 a i j a_{ij} aij

# 访问第二行第三个元素
print(x[1][2])

转置: 交换矩阵的行和列称为矩阵的转置( A T \mathbf{A^T} AT)。对于 B = A T \mathbf{B}=\mathbf{A^T} B=AT,有 b i j = a j i b_{ij}=a_{ji} bij=aji

print(x.T)
tensor([[ 0,  4,  8, 12, 16],
        [ 1,  5,  9, 13, 17],
        [ 2,  6, 10, 14, 18],
        [ 3,  7, 11, 15, 19]])

对称矩阵: 对称矩阵是特殊的方阵,方阵是特殊的矩阵。对于矩阵 A m n \mathbf{A_{mn}} Amn,有方阵( m = n m=n m=n),对称矩阵( A = A T \mathbf{A}=\mathbf{A^T} A=AT

B = torch.tensor([[1, 2, 3],
                  [2, 0, 4],
                  [3, 4, 5]])

print(B == B.T)
tensor([[True, True, True],
        [True, True, True],
        [True, True, True]])

矩阵是很有用的数据结构,其中的行可对应于不同的数据样本,列对应着不同的属性。


张量

现实世界并非是单纯的二维世界。图片,通常由 RGB 三个颜色通道构成,这就需要一个三维的数据结构来表示。而张量,可以用来表示任意维度数的数据结构。例如:向量是一阶张量,矩阵是二阶张量。

张量算法有两个基本性质:

  • 按元素运算: 两个张量按元素运算,要求其形状 shape 必须相同,张量中对应位置的标量将进行运算操作。
import torch

x = torch.tensor([1.0, 2, 4, 8])
y = torch.tensor([2, 2, 2, 2])
print("x=", x)
print("y=", y)
print("x+y=", x+y)
x= tensor([1., 2., 4., 8.])
y= tensor([2, 2, 2, 2])
x+y= tensor([ 3.,  4.,  6., 10.])
  • 广播机制: 张量的广播机制用于将张量扩展,要求两个向量要分别满足形状( x x x, y y y)与( y y y, z z z)方才可以进行运算。
import torch

a = torch.arange(3).reshape(3, 1)
b = torch.arange(2).reshape(1, 2)

print("a=", a)
print("b=", b)
print("a*b=", a*b)
a= tensor([[0],
        [1],
        [2]])
b= tensor([[0, 1]])
a*b= tensor([[0, 0],
        [0, 1],
        [0, 2]])

更多关于张量的操作博文,请移步:【深度学习】S1 预备知识 P1 张量


降维求和

对于一个张量,我们可以使用函数 sum() 进行简答求和;

import torch

x = torch.arange(12).reshape(3, -1)
print(x)
print(x.sum())
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])
tensor(66)

在默认情况下,调用求和函数会降低张量的维度直到变成一个标量。但是我们也可以通过 sum() 函数中的变量 axis= 来指定张量沿哪一个轴来进行求和操作。比如;

print(x.sum(axis=0))
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])
tensor([12, 15, 18, 21])

通过在函数 sum() 中设置 axis= 参数,我们可以沿着二维张量的横坐标将其合并成一维的张量向量。

另外,针对多维张量,我们还可以通过将 axis 参数设置为一个数组,来实现同时降低多个维度到指定的维度。

print(x.sum(axis=[0, 1]))
tensor(66)

观察结果可知,数据维度降至默认的标量形式。


非降维求和

然而,在某些情况下,我们可能希望保留计算出的和的结果的原始维度,此时,在 sum(axis=) 函数中需要增加设置 keepdims 参数;

print(x.sum(axis=0))
print(x.sum(axis=0, keepdims=True))
# 打印维度信息
print((x.sum(axis=0)).shape)
print((x.sum(axis=0, keepdims=True)).shape)
tensor([12, 15, 18, 21])
tensor([[12, 15, 18, 21]])
# 维度信息
torch.Size([4])
torch.Size([1, 4])

观察两个结果的对比,明显可以看出它们的维度存在差异。


累计求和

使用 cumsum() 函数,可以实现张量在某一维度上的累加求和操作。

import torch

x = torch.arange(12).reshape(3, -1)
print(x)
print(x.cumsum(axis=0))
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])
tensor([[ 0,  1,  2,  3],
        [ 4,  6,  8, 10],
        [12, 15, 18, 21]])

可以观察到,张量在其维度上进行逐层累加求和。如上,便是 cumsum() 函数。


点积与向量积

点积

点积(也称为内积)是指两个张量在对应位置上元素相乘后的和。

import torch

x = torch.arange(4, dtype=torch.float32)
y = torch.ones(4, dtype=torch.float32)
print("x=", x)
print("y=", y)
print(torch.dot(x, y))
x= tensor([0., 1., 2., 3.])
y= tensor([1., 1., 1., 1.])
tensor(6.)

上述结果: 6 = 0 ∗ 1 + 1 ∗ 1 + 2 ∗ 1 + 3 ∗ 1 6 = 0*1+1*1+2*1+3*1 6=01+11+21+31


矩阵-向量积

矩阵向量积,指的是矩阵与向量的乘法,也就是将矩阵与向量相乘得到一个新的向量。

e . g . e.g. e.g. 假设我们有矩阵 A \mathbf{A} A 和向量 v \mathbf{v} v,其中 A \mathbf{A} A 是一个 m ∗ n m*n mn 矩阵, v \mathbf{v} v 是一个 n n n 维向量,那么它们的向量积 A v \mathbf{Av} Av 是一个 m m m 维向量;

在这里插入图片描述

读者可以借助以下张量的示例来增进理解。

在张量中,通过 mv() 函数来实现矩阵向量积;其中 m m m 意味着矩阵 matrix, v v v 意味着向量 vector;

import torch

x = torch.arange(20, dtype=torch.float32).reshape(5, 4)
y = torch.ones(4, dtype=torch.float32)
print("x=", x)
print("y=", y)
print(torch.mv(x, y))
x= tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.],
        [12., 13., 14., 15.],
        [16., 17., 18., 19.]])
y= tensor([1., 1., 1., 1.])
tensor([ 6., 22., 38., 54., 70.])

矩阵-矩阵乘法

矩阵与矩阵乘法,可以看作简单地执行多次矩阵-向量积,并将结果拼接在一起形成矩阵。假设有两个矩阵 A \mathbf{A} A B \mathbf{B} B,其中 A \mathbf{A} A 是一个 m × n m×n m×n 的矩阵, B \mathbf{B} B 是一个 n × p n×p n×p 的矩阵,那么它们的乘积 C = A × B C=A×B C=A×B 是一个 m × p m×p m×p 的矩阵。

在这里插入图片描述

e . g . e.g. e.g. 矩阵-矩阵乘法使用 mm() 函数实现;

import torch

x = torch.arange(20, dtype=torch.float32).reshape(5, 4)
y = torch.ones(12, dtype=torch.float32).reshape(4, 3)
print("x=", x)
print("y=", y)
print(torch.mm(x, y))
x= tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.],
        [12., 13., 14., 15.],
        [16., 17., 18., 19.]])
y= tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]])
tensor([[ 6.,  6.,  6.],
        [22., 22., 22.],
        [38., 38., 38.],
        [54., 54., 54.],
        [70., 70., 70.]])

以上便是深度学习数学基础,线性代数第一部分;
线性代数第二部分将讲述 L 1 L1 L1 范数以及 L 2 L2 L2 范数,以及其张量实现。

如有任何问题,请留言或联系!谢谢!!

2024.2.13

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/385700.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

涛哥聊Python | pymunk,一个强大的 Python 库!

本文来源公众号“涛哥聊Python”,仅用于学术分享,侵权删,干货满满。 原文链接:pymunk,一个强大的 Python 库! 大家好,今天为大家分享一个强大的 Python 库 - pymunk。 Github地址:…

计算机二级C语言的注意事项及相应真题-4-程序修改

目录: 31.逐个比较p、q所指两个字符串对应位置中的字符,把ASCII值大或相等的字符依次存放到c所指数组中,形成一个新的字符串32.求矩阵(二维数组)a[N][N]中每行的最小值,结果存放到数组b中33.将一个十进制整数转换成r(二…

Vulnhub靶场 DC-9

目录 一、环境搭建 二、信息收集 1、主机发现 2、指纹识别 三、漏洞复现 1、dirsearch目录探测 2、sqlmap注入测试 3、文件包含漏洞 4、Knockd敲门服务 5、ssh爆破 ​​​​​​​6、提权 四、提取flag 一、环境搭建 Vulnhub靶机下载: 官网地址:https://…

Spring Boot 笔记 007 创建接口_登录

1.1 登录接口需求 1.2 JWT令牌 1.2.1 JWT原理 1.2.2 引入JWT坐标 1.2.3 单元测试 1.2.3.1 引入springboot单元测试坐标 1.2.3.2 在单元测试文件夹中创建测试类 1.2.3.3 运行测试类中的生成和解析方法 package com.geji;import com.auth0.jwt.JWT; import com.auth0.jwt.JWTV…

2.第一个Electron程序

目录 一、前言二、基本运行结构三、代码详解四、打包 一、前言 原文以及系列文章后续请参考:第一个Electron程序 上一章我们完成了Electron的环境搭建,本章就开始详解如何使用Electron开发一个完整的Electron桌面端程序。 注意开发环境,个…

可视化工具:将多种数据格式转化为交互式图形展示的利器

引言 在数据驱动的时代,数据的分析和理解对于决策过程至关重要。然而,不同的数据格式和结构使得数据的解读变得复杂和困难。为了解决这个问题,一种强大的可视化工具应运而生。这个工具具有将多种数据格式(包括JSON、YAML、XML、C…

【在Linux世界中追寻伟大的One Piece】Linux是从哪里来的?又是怎么发展的?基本指令你知道哪些?

目录 1 -> Linux背景 1.1 -> Linux发展史 1.1.1 -> UNIX发展历史 1.1.2 -> Linux发展历史 1.2 -> 开源 1.3 -> 官网 1.4 -> 企业应用现状 1.5 -> 发行版本 1.6 -> OS概念,定位 2 -> Linux下基本指令 2.1 -> Is指令 2…

不懂编程?节点包来凑——Dynamo常用节点包推荐(上)

由于篇幅有限,本次文章我们分上、下两篇,来分享给大家。 Dynamo作为一款辅助三维设计工具,他可以通过图形化的编程,帮我们解决很多在设计或者建模过程中遇到的小问题;同时他作为一款可视化编程软件,学起来…

1921:【02NOIP普及组】过河卒

1921:【02NOIP普及组】过河卒 【题目描述】 如图,A点有一个过河卒,需要走到目标B点。卒行走的规则:可以向下、或者向右。 同时在棋盘上的任一点有一个对方的马(如上图的C点),该马所在的点和所有…

turtle画闪烁发光的字体

使用随机生成的RGB颜色来绘制文本 # Author : 小红牛 # 微信公众号:WdPython import turtle as t import random import timet.title(闪烁发光的字体) t.setup(550, 100) t.bgcolor(black) t.ht()# 1.定义一个函数来生成随机RGB颜色 def get_RGB():return ("#…

五.实战软件部署 1-3实战章节-前言MYSQL 5.7版本在centos系统安装MYSQL 8.0版本在centos系统安装

目录 五.实战软件部署 1-实战章节-前言 五.实战软件部署 2-MYSQL 5.7版本在centos系统安装 1-配置yum仓库 2-使用yum安装mysql 3-安装完成后,启动mysql并配置开机自启动 4-检查mysql的运行状态 --配置 1-获取mysql的初识密码 2-登录mysql数据库系统 3-修改…

网安常用的三个攻击方式

1.渗透测试执行标准(PTES) 渗透测试执行标准由7个部分组成,包括前期交互、情报收集、威胁建模、漏洞分析、渗透利用、后渗透、撰写报告。在中国,渗透测试必须经过授权,否则就违背了网络安全法。前期交互主要指开展渗透…

书生谱语-基于 InternLM 和 LangChain 搭建知识库

大语言模型与外挂知识库(RAG)的优缺点 RAG方案构建与优化 作业 在创建web_demo时,需要根据教程将服务器端口映射到本地端口,另外需要将链接的demo从服务器中复制出来,不要直接从服务器打开demo页面,不然会…

Redis 单线程

文章目录 Redis单线程架构Redis 单线程访问速度IO多路复用原理 Redis单线程架构 Redis的单线程架构的效果为:Redis的单线程是对于服务端而言的,Redis允许多个Redis用户端同时在线操作,但同时只有一个用户端在和服务端交互。多个用户同时发送…

VMware清理拖拽缓存 Ubuntu硬盘情况占用分析

这两天在尝试编译Linux源码,我在win上将源码下载下来然后复制到ubuntu上,这一步我粗略看到了三种方法:安装VM tools,就可以使文件正常的在win和ubuntu中复制剪切;使用scp命令将win和linux系统链接起来;使用…

英伟达依托AI市值超谷歌,这波AI浪潮,你赶上了吗

随着人工智能(AI)技术的迅猛发展,全球科技行业的竞争格局正在发生着翻天覆地的变化。PS:如果你需要使用ChatGPT,可以参考这篇文章:【新手向】ChatGPT入门指南 - 订阅GPT4之前必须了解的十件事情 英伟达,一家以其高性能…

《Git 简易速速上手小册》第6章:Git 在持续集成/持续部署(CI/CD)中的应用(2024 最新版)

文章目录 6.1 CI/CD基础6.1.1 基础知识讲解6.1.2 重点案例:为 Python Web 应用实现 CI/CD6.1.3 拓展案例 1:自动化部署到云平台6.1.4 拓展案例 2:使用 Docker 容器化部署 6.2 Git 与自动化测试6.2.1 基础知识讲解6.2.2 重点案例:为…

二叉树的垂直遍历

1.题目 这道题是2024-2-13的签到题,题目难度为困难。 考察的知识点是DFS算法和自定义排序。 题目链接:二叉树的垂直遍历 给你二叉树的根结点 root ,请你设计算法计算二叉树的 垂序遍历 序列。 对位于 (row, col) 的每个结点而言&#xff…

卷积神经网络(CNN)

本文仅在理论方面讲述CNN相关的知识,并给出AlexNet, Agg, ResNet等网络结构的代码。 1.构成 ​ 由输入层、卷积层、池化层、全连接层构成。 输入层:输入数据卷积层:提取图像特征池化层:压缩特征全连接层:为输出准备…

解锁未来:探秘Zxing二维码技术的神奇世界

解锁未来:探秘Zxing二维码技术的神奇世界 1. 引言 在当今数字化和智能化的社会中,二维码技术已经成为人们生活中不可或缺的一部分。从商品购物、支付结算到健康码、门票核销,二维码无处不在,极大地方便了人们的生活和工作。而Zx…
最新文章