MySQL的事务隔离是如何实现的?

目录

从一个例子说起

快照读和当前读

 事务的启动时机和读视图生成的时刻

MVCC

隐藏字段

Undo Log回滚日志

Read View - 读视图

可重复读(RC)隔离级别下的MVCC

读提交(RR)隔离级别下的MCC

关于MVCC的一些疑问 

1.为什么需要 MVCC ?如果没有 MVCC 会怎样?

2.多版本,是在索引保存了该行数据的多个版本吗?

总结

从一个例子说起

当数据库上有多个事务同时执行的时候,就可能出现脏读(dirty read)、不可重复读(non-repeatable read)、幻读(phantom read)的问题,为了解决这些问题,就有了“隔离级别”的概念。

MySQL有4个隔离级别:

  • 读未提交:一个事务还没提交时,它做的变更就能被别的事务看到。
  • 读提交:一个事务提交之后,它做的变更才会被其他事务看到。
  • 可重复读:一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数据是一致的。当然在可重复读隔离级别下,未提交变更对其他事务也是不可见的。
  • 串行化:顾名思义是对于同一行记录,“写”会加“写锁”,“读”会加“读锁”。当出现读写锁冲突的时候,后访问的事务必须等前一个事务执行完成,才能继续执行。

用一个例子说明这几种隔离级别。假设数据表 T 中只有一列,其中一行的值为 1,下面是按照时间顺序执行两个事务的行为。

mysql> create table T(c int) engine=InnoDB;
insert into T(c) values(1);

在不同的隔离级别中,事务 A 会有不同的返回结果,也就是图里面 V1、V2、V3 的返回值会不同。

  • 隔离级别是“读未提交”, 则 V1 的值就是 2。这时候事务 B 虽然还没有提交,但是结果已经被 A 看到了。因此,V2、V3 也都是 2。
  • 隔离级别是“读提交”,则 V1 是 1,V2 的值是 2。事务 B 的更新在提交后才能被 A 看到。所以,V1还是1,而 V3 的值是 2。
  • 隔离级别是“可重复读”,则 V1、V2 是 1,V3 是 2。之所以 V2 还是 1,遵循的就是这个要求:事务在执行期间看到的数据前后必须是一致的。
  • 隔离级别是“串行化”,则在事务 B 执行“将 1 改成 2”的时候,会被锁住。直到事务 A 提交后,事务 B 才可以继续执行。所以从 A 的角度看, V1、V2 值是 1,V3 的值是 2。

在实现上,数据库里面会创建一个视图read-view),访问的时候以视图的逻辑结果为准。在“可重复读”隔离级别下,这个视图是在事务启动时创建的,整个事务存在期间都用这个视图。在“读提交”隔离级别下,这个视图是在每个 SQL 语句开始执行的时候创建的。

这里需要先讲解下当前读和快照读 和 事务的启动时机和读视图生成的时刻

快照读和当前读

MySQL读取数据实际上有两种模式,分别是当前读和快照读。

快照读:普通的select语句(即是不加锁的select操作) 都是采用 快照读的模式。

当前读:数据修改的操作(update、insert、delete) 和select ... lock in share mode; select ... for update;都是采用 当前读的模式,对读取到的数据(索引记录)加锁来保证数据一致性,是读到最新的数据。

 事务的启动时机和读视图生成的时刻

在 MySQL 有两种开启事务的命令,分别是:

  • 第一种:begin/start transaction 命令;
  • 第二种:start transaction with consistent snapshot 命令;

begin/start transaction 命令并不是一个事务的起点,在执行到它们之后的第一个操作 InnoDB 表的语句,事务才真正启动。如果你想要马上启动一个事务,可以使用 start transaction with consistent snapshot 这个命令。

第一种启动方式,一致性视图是在执行第一个快照读语句时创建的;

第二种启动方式,一致性视图是在执行start transaction with consistent snapshot 时创建的。

说到视图read-view),那就会引出MVCC。而事务隔离就是通过MVCC来实现的

更加准确来说,实现事务隔离的方法是有两种:

  • 针对快照读(普通 select 语句),是通过 MVCC 方式解决了幻读,因为可重复读隔离级别下,事务执行过程中看到的数据,一直跟这个事务启动时看到的数据是一致的,即使中途有其他事务插入了一条数据,是查询不出来这条数据的,所以就很好了避免幻读问题。
  • 针对当前读(select ... for update 等语句),是通过 next-key lock(记录锁+间隙锁)方式解决了幻读,因为当执行 select ... for update 语句的时候,会加上 next-key lock,如果有其他事务在 next-key lock 锁范围内插入了一条记录,那么这个插入语句就会被阻塞,无法成功插入,所以就很好了避免幻读问题。

所以,事务隔离是通过MVCC 和 加锁 实现的

那么,MVCC 用来实现哪几个隔离级别?

  • 隔离级别如果是读未提交的话,直接读最新版本的数据就行了,根本就不需要保存以前的版本,即是“读未提交”隔离没有视图概念。
  • 可串行化隔离级别事务都串行执行了(就是直接加锁避免并行访问),所以也不需要多版本。
  • 因此 MVCC 是用来实现读已提交和可重复读

MVCC

多版本并发控制(Multi-Version  Concurrency Control)是一种用来解决读-写冲突的无锁并发控制,可以做到在读操作时不用阻塞写操作,写操作也不用阻塞读操作,提高了数据库并发读写的性能。

最早的数据库系统,只有读读之间可以并发,读写,写读,写写都要阻塞。引入多版本之后,只有写写之间相互阻塞,其他三种操作都可以并行,这样大幅度提高了 InnoDB 的并发度。

实现原理主要是依赖记录中的 三个隐藏字段undo日志 ,Read View 来实现的。

隐藏字段

innodb引擎保存的行数据是有三个隐藏字段的。

 具体的内容可以查看该文章MySQL的一行数据是如何存储的? 

 innodb引擎表 的聚簇索引保存的数据就是完整的行数据(即是上图的数据)。这里就主要是使用TRX_ID和ROLL_PTR。

DB_TRX_ID

最近修改事务ID,记录插入这条记录或最后一次修改该记录的事务ID。

DB_ROLL_PTR

回滚指针,指向这条记录的上一个版本,即是指向指向 undo log 的指针。用于配合Undo Log,指向上一个版本。

 每次对某条聚簇索引记录进行改动时,都会把旧版本的记录写入到 undo 日志中。DB_ROLL_PTR是个指针,指向每一个旧版本记录,于是就可以通过它找到修改前的记录。

Undo Log回滚日志

  • 这个是在增、改、删操作的时候产生的便于数据回滚的日志。
  • INSERT操作的时候,产生的回滚日志在事务提交后可被立即删除。而UPDATEDELETE操作的时候,产生的Undo Log日志不仅在进行数据回滚时需要,在进行快照读时也需要,所以不会立即被删除
  • 因为undo log 记录事务修改之前版本的数据信息,因此假如由于系统错误或者rollback操作而回滚的话可以根据undo log的信息来进行回滚到没被修改前的状态。

undo log 版本链 

用一个表做例子 ,建表和初始化语句如下。

mysql> CREATE TABLE `t` (
  `id` int NOT NULL,
  `age` int DEFAULT NULL,
  `name` varchar(10) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;
insert into t values(1,30,'a30');

​ 不同事务或相同事务对同一条记录进行修改,会导致该记录的undolog生成一条记录版本链表,链表的头部是最新的旧记录,链表尾部是最早的旧记录。DB_ROLL_PTR回滚指针指向Undo Log数据地址形成一个链表。我们把这个链表称之为 版本链

Read View - 读视图

Read View就是事务进行快照读操作的时候生产的读视图(Read View),在该事务执行的快照读的那一刻(select ....),会生成数据库系统当前的一个快照,记录并维护系统当前活跃事务的ID(当每个事务开启时,都会被分配一个ID, 这个ID是递增的,所以最新的事务,ID值越大)。

已经弄清楚版本链后,而 readView 就是用来判断哪个版本对当前事务可见的。

readView中有4个概念:

  • m_ids :指的是在创建 Read View 时,当前数据库中「活跃事务」的事务 id 列表,注意是一个列表,“活跃事务”指的就是,启动了但还没提交的事务
  • min_trx_id :指的是在创建 Read View 时,当前数据库中「活跃事务」中事务 id 最小的事务,也就是 m_ids 的最小值。
  • max_trx_id :这个并不是 m_ids 的最大值,而是创建 Read View 时当前数据库中应该给下一个事务的 id 值,也就是全局事务中最大的事务 id 值 + 1;
  • creator_trx_id :指的是创建该 Read View 的事务的事务 id

知道版本链和读视图后,那如何通过读视图来判断哪个版本对当前事务是可见的呢?

代码中判断的逻辑如下:

最新版本开始沿着版本链逐渐寻找老的版本,如果遇到符合任一条件的版本就返回。

注意:在不同的隔离级别下快照读生成的ReadView规则不同:

  • read committed (读已提交):事务每次select时创建ReadView
  • repeatable read (可重复读):事务第一次select时创建ReadView,后续一直使用

而我们写sql语句后进行分析可见版本,是看不到min_trx_id和max_trx_id这些数据的。那我们用另一种方式来判断。

不知min_trx_id等数据的分析规则

一个数据版本,对于一个事务视图来说,除了自己的更新总是可见以外,有三种情况:

  1. 版本未提交,不可见;
  2. 版本已提交,但是是在视图创建后提交的,不可见;
  3. 版本已提交,而且是在视图创建前提交的,可见。

这种通过 版本链 来控制并发事务访问同一个记录时的行为就叫 MVCC(多版本并发控制)

可重复读(RC)隔离级别下的MVCC

用一个表做例子 ,建表和初始化语句如下。

mysql> CREATE TABLE `t` (
  `id` int NOT NULL,
  `age` int DEFAULT NULL,
  `name` varchar(10) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;
insert into t values(30,30,'a30');

从上图时间顺序,事务2先启动,跟着是事务3,4,5依次启动。事务2对应的事务id是2,依次类推。

因为是RC隔离级别,所以每次select都会生成新的快照。

下面是每次提交事务生成的版本链&第一次快照读的ReadView

只分析事务5中的select,从最新版本开始沿着版本链逐渐寻找老的版本。

第一次select:

  • 当前最新版本的事务id是4,所以trx_id为4,不等于create_trx_id,所以不符合条件①。条件②,③,④也都不符合。所以事务id是4的版本不可见。
  • 跟着是老版本,事务id为3的版本,条件①不符合,条件②(3<3不符合)不符合。条件③(3<6),说明可能可以可见;条件④,3在[3,4,5]范围内,说明该版本在活跃事务列表中,未提交,不可见。所以事务id是3的版本不可见。
  • 事务id是2的版本,trx_id=2。条件①不符合,条件②符合(2<3)。所以事务id=2的版本可见

 查看上图的并发执行过程,对比事务5,发现事务2是已提交,因此此刻可以读取事务2提交过的数据。

第二次select也是这样分析,但注意的是在RC隔离级别下,是生成新的读视图的,这里还是按照上面的逻辑分析的,这里就不具体写了,留给读者分析。

用不知min_trx_id等数据的分析规则进行分析

第一次select:

  • 从最新版本开始查看,最新版本是事务id为4的,还没提交,属于情况1,不可见。
  • 到事务id为3的版本,还未提交,属于情况1,不可见。
  • 到事务id为2的版本,该版本已提交,而且是在视图创建前提交的(即是在事务5创建视图前),属于情况3,所以事务id为2的版本可见。

第二次select:

  • 从最新版本开始查看,最新版本是事务id为4的,还没提交,属于情况1,不可见。
  • 到事务id为3的版本,已提交,并且在视图创建前提交的(即是在事务创建视图前,第二次select),属于情况3,所以事务id为3的版本可见。

读提交(RR)隔离级别下的MCC

 这里的事务执行顺序和RC隔离级别的是一样的。

在RR隔离级别下,只是在事务中第一次快照读时生成ReadView,后续都是复用该 ReadView,那么既然ReadView都一样, ReadView的版本链匹配规则也一样, 那么最终快照读返 回的结果也是一样的。而且都是和RC隔离级别第一次select中的结果一样的。分析过程和RC级别的一样。

用不知min_trx_id等数据的分析规则进行分析

第一次select:和RC隔离级别的第一次select是一样的,事务id是2的版本可见。

第二次select:

  • 从最新版本开始查看,最新版本是事务id为4的,还没提交,属于情况1,不可见。
  • 到事务id为3的版本,已提交,但是是在视图创建后提交的(即是在事务5创建视图前,因为RR级别是延用第一次生成的视图),属于情况2,不可见。
  • 到事务id为2的版本,该版本已提交,而且是在视图创建前提交的(即是在事务5创建视图前),属于情况3,所以事务id为2的版本可见。

这样分析第一次select和第一次select读取的数据是一致的。

关于MVCC的一些疑问 

1.为什么需要 MVCC ?如果没有 MVCC 会怎样?

如果没有MVCC读写操作之间会有冲突。

假设一个场景:

事务A在执行中,此时事务B修改了记录1,还没提交;而此时事务A想要读取记录1。事务B还没提交,所以事务A无法提取到最新的记录1,不然就是脏读了。

那么事务A就是应该读取被事务B修改前的记录。但是记录1已被事务B修改了,那就只能用锁,用锁阻塞等到事务B的提交。这种实现就是基于锁的并发控制 ,Lock Based Concurrency Control(LBCC)。

这时,如果有多版本就好了,保存事务B修改记录1之前的版本数据。此时事务A就可以读取之前版本的数据,这样读写操作就不会阻塞,也不用加锁。所以说 MVCC 提高了事务的并发度,提升数据库的性能。

2.多版本,是在索引保存了该行数据的多个版本吗?

这个多版本说法只是为了便于理解或者说展现出来像多版本的样子而已。

 InnoDB 不会真的存储多个版本的数据,只是借助 undo log 记录每次写操作的反向操作,所以索引上对应的记录只会有一个版本(即最新版本)。只不过可以根据 undo log 中的记录反向操作得到数据的历史版本,所以看起来是多个版本。

总结

事务是在 MySQL 引擎层实现的,默认的 InnoDB 引擎支持事务。

MySQL InnoDB 引擎的默认隔离级别是 可重复读(RR),但不建议将隔离级别升级为串行化,因为这会导致数据库并发时性能很差。RR隔离级别是可以很大程度避免幻读现象(并不是完全解决),解决的方案有两种:

  • 针对快照读(普通 select 语句),是通过 MVCC 方式解决了幻读,因为可重复读隔离级别下,事务执行过程中看到的数据,一直跟这个事务启动时看到的数据是一致的,即使中途有其他事务插入了一条数据,是查询不出来这条数据的,所以就很好了避免幻读问题。
  • 针对当前读(select ... for update 等语句),是通过 next-key lock(记录锁+间隙锁)方式解决了幻读,因为当执行 select ... for update 语句的时候,会加上 next-key lock,如果有其他事务在 next-key lock 锁范围内插入了一条记录,那么这个插入语句就会被阻塞,无法成功插入,所以就很好了避免幻读问题。

所以,事务隔离是通过MVCC 和 加锁 实现的。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/454950.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Windows-WSL2-VSCode+Docker配置C++开发环境

Windows-WSL2-VSCodeDocker配置C开发环境 写在前面 因为在学习工作中&#xff0c;需要不同的编码环境&#xff0c;若将这些不同的开发环境都状态一台设备上&#xff0c;很容易出问题&#xff0c;而且迁移性差&#xff0c;于是计划把不同的开发环境用docker隔离开来&#xff0…

Llama-3公布基础训练设施,使用49000个H100

3月13日&#xff0c;社交、科技巨头Meta在官网公布了两个全新的24K H100 GPU集群&#xff08;49,152个&#xff09;&#xff0c;专门用于训练大模型Llama-3。 此外&#xff0c;Llama-3使用了RoCEv2网络&#xff0c;基于Tectonic/Hammerspace的NFS/FUSE网络存储&#xff0c;继续…

嵌入式开发--基于STM32G431RBTx-按键中断

嵌入式开发–STM32G431RBTx-按键 将如下引脚口都设置为输出上拉模式 PB0&#xff0c;PB1&#xff0c;PB2&#xff0c;PA0 设置为上拉模式 配置定时器 如图有反映stm32g431的定时器资源。 时钟源选择外部时钟 设定系数 第一个是分频系数(Prescaler) 第二个是周期计数值&…

F.岛屿个数【蓝桥杯】/dfs+环

岛屿个数 小蓝得到了一副大小为 M N 的格子地图&#xff0c;可以将其视作一个只包含字符‘0’&#xff08;代表海水&#xff09;和 ‘1’&#xff08;代表陆地&#xff09;的二维数组&#xff0c;地图之外可以视作全部是海水&#xff0c;每个岛屿由在上/下/左/右四个方向上相…

记一次生产慢sql索引优化及思考

记一次生产慢sql索引优化及思考 问题重现 夜黑风高的某一晚&#xff0c;突然收到一条运营后台数据库慢sql的报警&#xff0c;耗时竟然达到了60s。看了一下&#xff0c;还好不是很频繁&#xff0c;内心会更加从容排查问题&#xff0c;应该是特定条件下没有走到索引导致&#x…

Jmeter---逻辑控制器

if 控制器 1. 先添加一个 用户自定义的变量&#xff0c;并填写变量名和值 2.再添加一个if控制器&#xff0c;并填写判断内容 【语法&#xff1a;""""】 forEach控制器 1. 先添加一个用户自定义变量 2. 再添加一个forEach控制器 循环控制器 1. 添加循环…

【2024-03-12】设计模式之模板模式的理解

实际应用场景&#xff1a;制作月饼 过程描述&#xff1a; 一开始&#xff0c;由人工制作月饼&#xff0c; 第一个&#xff1a;根据脑子里面月饼的形状&#xff0c;先涅出月饼的形状&#xff0c;然后放入面粉和馅料把开口合并起来。 第二个&#xff1a;根据脑子里面月饼的形状&…

ASP.NET排课实验室排课,生成班级课表实验室课表教师课表(vb.net)-214-(代码+说明)

转载地址: http://www.3q2008.com/soft/search.asp?keyword214 要看成品演示 请联系客服发给您成品演示 课题&#xff1a;实验课排课系统 计算机 上机课 一周上5天课&#xff0c;周一到周五 一周上5天课&#xff0c;周一到周五 因为我排的是实验课&#xff0c;最好1&#xf…

【Paper Reading】6.RLHF-V 提出用RLHF的1.4k的数据微调显著降低MLLM的虚幻问题

分类 内容 论文题目 RLHF-V: Towards Trustworthy MLLMs via Behavior Alignment from Fine-grained Correctional Human Feedback 作者 作者团队&#xff1a;由来自清华大学和新加坡国立大学的研究者组成&#xff0c;包括Tianyu Yu, Yuan Yao, Haoye Zhang, Taiwen He, Y…

HTML静态网页成品作业(HTML+CSS)——家乡广州介绍设计制作(5个页面)

&#x1f389;不定期分享源码&#xff0c;关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 &#x1f3f7;️本套采用HTMLCSS&#xff0c;未使用Javacsript代码&#xff0c;共有5个页面。 二、作品演示 三、代…

SpringBoot(Lombok + Spring Initailizr + yaml)

1.Lombok 1.基本介绍 2.应用实例 1.pom.xml 引入Lombok&#xff0c;使用版本仲裁 <!--导入springboot父工程--><parent><artifactId>spring-boot-starter-parent</artifactId><groupId>org.springframework.boot</groupId><version&g…

[论文笔记] pai-megatron qwen1.5报错

Qwen1.5-0.5b-chat 使用example中fintune.py 报错 Issue #77 QwenLM/Qwen1.5 GitHub 解决方案&#xff1a; transformers升级到4.37.0 pip install setuptools65.5.1 pip install transformers4.37.0

Matlab|【分布鲁棒】数据驱动的多离散场景电热综合能源系统分布鲁棒优化算法

目录 主要内容 1.1 主要难点-分布鲁棒优化 1.2 程序求解步骤-主子问题迭代 部分结果 下载链接 主要内容 本程序主要对《基于场景聚类的主动配电网分布鲁棒综合优化》-高海淑的方法复现&#xff0c;应用到综合能源电热微网方向&#xff0c;采用拉丁超立方抽样对不同…

鸿蒙API9+axios封装一个通用工具类

使用方式&#xff1a; 打开Harmony第三方工具仓&#xff0c;找到axios&#xff0c;如图&#xff1a; 第三方工具仓网址&#xff1a;https://ohpm.openharmony.cn/#/cn/home 在你的项目执行命令&#xff1a;ohpm install ohos/axios 前提是你已经装好了ohpm &#xff0c;如果没…

【Flutter 面试题】怎么理解Flutter的Isolate?并发编程

【Flutter 面试题】怎么理解Flutter的Isolate&#xff1f;并发编程 文章目录 写在前面解答补充说明完整代码示例说明 写在前面 &#x1f64b; 关于我 &#xff0c;小雨青年 &#x1f449; CSDN博客专家&#xff0c;GitChat专栏作者&#xff0c;阿里云社区专家博主&#xff0c;…

Qt-QPainter drawText方法不同重载之间的区别

QPainter类的drawText方法有如下重载&#xff1a; void drawText(const QPointF &position, const QString &text) void drawText(const QPoint &position, const QString &text) void drawText(int x, int y, const QString &text) void drawText(co…

解决尚品甄选验证码图片无法显示bug

按照他的视频要求去做发现图片无法正常显示&#xff0c;通过查看浏览器网络错误&#xff0c;发现请求验证码的网址是重叠的http://localhost:3001/admin/system/index/login/admin/system/index/generateValidateCode是这样的&#xff0c;说明baseUrl是/admin/system/index/log…

【Python如何与电脑玩石头剪刀布游戏】

1、石头剪刀布Python代码如下&#xff1a; import random while True:a random.randint(0, 2)b int(input("请输入一个数字&#xff08;0石头, 1剪刀, 2布&#xff09;: "))c [石头, 剪刀, 布]if b ! 0 and b ! 1 and b ! 2:print("傻子&#xff0c;你出错了…

Cisco Packet Tracer模拟器实现路由器的路由配置及网络的安全配置

1. 内容 1. 配置路由器实现多个不同网络间的通信&#xff0c;路由器提供的路由协议包括静态路由协议、RIP动态路由、OSPF动态路由协议等等&#xff0c;训练内容包括路由器的静态路由配置、路由器的RIP动态路由配置、路由器的OSPF动态路由配置以及路由器的路由重分布配置。 2.…

测试环境搭建整套大数据系统(十一:docker部署superset,无密码登录嵌入html)

一&#xff1a;安装docker 参考文档 https://blog.csdn.net/weixin_43446246/article/details/136554243 二&#xff1a;安装superset 下载镜像。 拉取镜像&#xff08;docker pull amancevice/superset&#xff09; 查看镜像是否下载完成&#xff08;docker images&#xf…
最新文章