【MySQL性能优化】- 一文了解MVCC机制

MySQL理解MVCC

😄生命不息,写作不止
🔥 继续踏上学习之路,学之分享笔记
👊 总有一天我也能像各位大佬一样
🏆 博客首页   @怒放吧德德  To记录领地
🌝分享学习心得,欢迎指正,大家一起学习成长!
转发请携带作者信息 @怒放吧德德 @一个有梦有戏的人

在这里插入图片描述

文章目录

  • MySQL理解MVCC
    • 简介
    • 理解MVCC
      • undo日志版本链
      • read-view机制
      • 版本链对比规则
    • 案例理解
      • 可重复读
        • 时刻6查询
        • 时刻9查询
        • 时刻13查询
        • 时刻14查询
      • 读已提交
        • 时刻9查询
        • 时刻13查询
    • 总结

转发请携带作者信息 @怒放吧德德 @一个有梦有戏的人

简介

多版本并发控制(MVCC,Multi-Version Concurrency Control)是一种常用于数据库管理系统的并发控制方法,MySQL数据库中的InnoDB存储引擎就实现了这种技术。MVCC通过在每个事务中对数据进行版本控制来实现多个事务的高效并发执行,增强了数据库的读写性能,并且减少了锁的需求。

理解MVCC

在MySQL的可重复读的隔离级别中,同样的SQL查询语句在同一个事务中,查出来的数据是一致的,其他事务对这些数据进行修改,当前事务是不可见的。
这个隔离级别就是由MVCC机制来实现的。对一行数据并不会通过对读和写加互斥锁来保证隔离性,避免了频繁加锁互斥,而串行化隔离级别是通过读写互斥实现。

MySQL中读以提交和可重复读隔离级别都是通过MVCC。

undo日志版本链

undo日志版本链是指一行数据被多个事务依次修改后,为了保持数据修改之前版本的可访问性,InnoDB不会直接覆盖旧数据。会将数据的旧版本保存到undo日志中,并且用隐藏字段trx_id(事务id)和roll_pointer(回滚指针)将这些日志串联起来成为一组历史版本链。

这个undo日志不只是保存单个版本,而是随着时间推移和更多事务的执行,可能保存同一数据项的多个历史版本。这些历史版本形成一个链条,称为版本链。当需要某个记录的历史状态时,可以通过回滚undo日志中的操作来获取旧版本数据,或者在不同隔离级别的读取事务中适当地提供旧数据,以此来保证一致性读取。

如下图,可以很好的理解什么是undo日志版本链
在这里插入图片描述

如上图,我们在插入数据的时候,会开启事务,所以会带着一个事务id,接着对这条数据进行修改,MySQL也会将修改的数据加上事务id以及回滚指针(roll_pointer),并且由这个回滚指针来指向上一个事务的旧数据版本,这样就构成了日志版本链。

read-view机制

read-view机制是InnoDB存储引擎实现MVCC的一种来创建一致性读取视图的技术。主要作用是用来确保可重复读和读已提交的隔离级别下,事务能够读到一致的数据快照,即使其他事务在对数据进行修改。
当一个事务想要执行一致性读取操作时候,InnoDB通过多版本并发控制(MVCC)来保存数据的多个版本,每个版本都有一个唯一的事务ID(trx_id)与之关联。read-view机制就会创建一个视图,这个视图是由执行查询时所有未提交的事务id数组组成(数组最小的事务id为min_trx_id)和已创建事务最大id为max_trx_id组成,还有一个creator_trx_id,用来表示生成该read-view的事务ID。
在这里插入图片描述

以上图示read-view机制的区间。

版本链对比规则

1、如果trx_id<min_trx_id,表示生成该版本的事务在事务开始之前已经提交,则该版本对事务可见。
2、如果trx_id>max_trx_id,表示生成该版本的事务在事务开始后才开始,则该版本对事务不可见。
3、如果min_trx_id≤trx_id≤max_trx_id,则需要判断是否在视图数组trx_ids中。

  • 1)、如果trx_id在视图中,表示生成该版本是还没提交的事务,因此该版本对事务不可见。
  • 2)、如果trx_id不在视图中,表示生成该版本的事务是已提交的,因此该版本对事务可见。

对于删除的情况,会将版本链的最新数据复制一份,然后将trx_id修改成删除操作的trx_id,同时会在记录的头信息的标记位(delete_flag)上设置true,用来表示已经删除,在查询时,如果对应记录的delete_flag为true,则表示已经被删除,就不会返回数据。

案例理解

接下来我们通过一个案例来理解。(本次通过上篇文章所用到的数据表来作为案例)
我们假设有三个事务,根据时间顺序会执行不同操作(这里在如下的excel图中会有时刻来标记),以及提交的时间点不同,由此案例来了解MVCC机制是如何通过undo日志版本链和read-view机制工作的。并且介绍可重复读以及读已提交的MVCC机制。

可重复读

首先,假设我们插入一条新的数据(id=12)。然后我们有几个事务在执行各种操作,并且都有相应的事务id,具体的执行过程如下的excel图,用来明确表示各个事务在时间戳的执行流程。
在这里插入图片描述

注:这里需要注意一下,begin/start transation命令并不是一个事务的起点,具体真正开启事务是在执行到第一个修改操作InnoDB表的语句,这时候才会有事务id,MySQL内部是按照事务的启动顺序来分配事务id的。

时刻6查询

首先来看一种情况,事务id:100和101执行了更新操作,但是没提交,事务id:102对id=12进行了更新,并且提交事务,我们通过另一个会话进行查询id=12的这条记录,可见查出的first_name是102更新的数据。
在这里插入图片描述

我们来深入了解这MVCC机制,是如何从undo日志版本链中进行比对获取这个102所更新的数据。
如下图,首先我们需要知道read-view所选中的min_trx_id和max_trx_id。通过当前系统中活跃的最小事务id,从表格中可以看出min_trx_id是事务100,已创建事务最大id为max_trx_id是事务102,100,101是未提交的活跃事务。read-view:[100, 101], 102。

read-view {
  m_ids: [100, 101],   // 事务100和事务101均未提交
  min_trx_id: 100,     // 活跃未提交事务中最小的事务ID
  max_trx_id: 102,     // 已创建事务最大事务的ID
  creator_trx_id: 102  // 创建这个read-view的当前事务的ID
}

在这里插入图片描述

从日志版本链中看出事务102修改后会将回滚指针指向事务id为60上。然后就是进行版本链比对,当前row的trx_id=102,刚好是等于max_trx_id,接着需要判断这个102事务id是否在视图上,显然102是不在[100,101]中,所以就会认为这条数据是可见的,于是输出的值就是102这个事务的数据。

时刻9查询

我们接着往下走,事务id为100的事务执行了两次对id为12的记录进行更新,两次更新之后,事务还没提交,此时select 1会话又进行了一次查询。此时的查出来的数据依然是Liyongde,依旧是事务102更新的数据。
在这里插入图片描述

我们再来分析这个过程。此时如下图,read-view:[100,101], 102。
在这里插入图片描述

根据版本链,最新的数据是事务100更新的数据“Li2”,但是根据版本链规则判断,事务id=100属于视图数组里面,并且是没有提交的,于是就往版本链指向的版本进行判断,直到到达事务id=102的这条记录,不属于视图数组中,认为是可见的,因此返回的数据是“Liyongde”。

时刻13查询

接着看下一种情况,事务100提交了,随即事务101进行了一次更新,并且不提交,此时数据库的数据肯定是“Li2”,之后select 1进行查询id=12的记录,此时的read-view又是否会发生变化呢?得到的结果又是什么呢?
在这里插入图片描述

可见查出来的数据还是“Liyongde”,这是符合可重复读隔离级别的。还是需要通过undo日志版本链的规则来进行研究为什么得到的数据还是事务102提交的数据。
先确定视图数组,在可重复读级别下,同事务中的read-view是不会发生变化。所以依然是[100,101], 102。
在这里插入图片描述

此时数据库id=12是“Li2”,但是查出来的数据还是“Liyongde”,这是MVCC机制通过日志版本链的比对规则,从而达到可重复读的隔离机制。首先当前的trx_id=101,而101处于min_trx_id与max_trx_id之间,进一步判断是在视图里面,所以不可见,依此类推直到102不在视图中,则得到的记录是“Liyongde”。因为一致性视图在同事务并不会发生变化,因此,即便直到100,101,102三个事务全部都提交之后,Select 1查询得到的数据依旧是“Liyongde”。

注:在可重复读级别下,同事务中的read-view是不会发生变化。
这是因为可重复读的设计原则就是确保在同一个事务执行过程中,所看到的数据总是与事务在启动时看到的数据保持一致。当事务启动时,它会创建一个read-view,这个read-view在事务的整个生命周期内都是固定的,不会随着其他事务的提交或修改而改变。这样,即使在事务执行期间有其他事务修改了数据,当前事务所看到的数据仍然与启动时一致,从而保证了数据的可重复读性。因此,在可重复读的隔离级别下,同一个事务的read-view是不会变化的。

时刻14查询

如果此时有个新的事务Select 2,这个事务也是没有分配事务id,一直下来也没有执行查询操作,直到100,102都提交之后在执行了查询。那么此时的查询结果会是什么?
在这里插入图片描述

一致性视图(read-view)的状态取决于事务的启动时刻。根据excel图,我们可以知道创建的read-view数据以及日志版本链,如下图。
在这里插入图片描述

根据版本连的对比,可以得出此时事务查出的数据是“Li2”。当数据库事务开启之后的头一次查询,实际上read-view就已经创建了。我们通过以下例子来测试这个结果。
在这里插入图片描述

因为1是在修改之前进行了查询,此时就已经创建了一致性视图,接着进行修改值,哪怕已经提交了,查出来的结果依然是之前的数据;而2是在修改提交之后才进行的查询,此时创建的一致性视图就已经是更新过的事务数据。

读已提交

如上的案例,我们知道,在可重复读的隔离机制下,read-view是在开启事务的第一次查询就已经创建了,并且是直到事务的结束之前是不会发生变化。而接下来要介绍的读已提交隔离级别就有点不同,主要是read-view的创建,在读已提交的隔离级别下,read-view会在每次的查询的时候进行变化。

时刻9查询

根据上面的excel图,在时刻9的查询中,我们可以得出此时创建的read-view,事务102是提交的,事务100和101都是活跃未提交的事务,所以活跃数组则是[100, 101],当前事务为102,min_trx_id=100,max_trx_id=102。
接着就是一样的进行日志版本对比,对比规则与上文提到的方式是一致的,102不在视图中,所以数据可见,最后返回的是“Liyongde”。

时刻13查询

接着再来看看时刻13的情况,这个时候事务100也提交了,因为读已提交的read-view会在每次的查询发生变化,那么此时活跃事务就剩下了101,所以数组是[101],当前事务为102,min_trx_id=101,max_trx_id=102。
接着就是判断了,根据规则进行比对,最新的版本链中是事务id101,其是落在视图中,所以是不可见的数据,接着往上个版本看,事务id100是小于min_trx_id,因此此条数据是可见的。
在这里插入图片描述

总结

MVCC是一种用于解决数据库并发问题的乐观锁技术,多版本并发控制通过保存数据在某个时间点的快照来实现。换句话说,读操作不会阻塞写操作,写操作也不会阻塞读操作,以此来提高数据库性能。在每次对数据的操作,都用在undo日志版本链中进行。

👍创作不易,如有错误请指正,感谢观看!记得点赞哦!👍

转发请携带作者信息 @怒放吧德德 @一个有梦有戏的人

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/455941.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

打卡学习kubernetes——kubernetes架构原理

接上一篇的内容&#xff0c;除了核心组件&#xff0c;还有一些推荐的Add-ons&#xff1a; kube-dns 负责为整个集群提供DNS服务Ingress Controller 为服务提供外网入口Heapster 提供资源监控&#xff08;没用过这个&#xff0c;但是用过grafana&#xff0c;很方便&#xf…

5.Python从入门到精通—Python 运算符

5.Python从入门到精通—Python 运算符 Python 运算符算术运算符比较&#xff08;关系&#xff09;运算符赋值运算符逻辑运算符位运算符成员运算符身份运算符运算符优先级 Python 运算符 Python语言支持以下类型的运算符: 算术运算符比较&#xff08;关系&#xff09;运算符赋…

基于YOLOv5的火灾检测系统

&#x1f4a1;&#x1f4a1;&#x1f4a1;本文主要内容:详细介绍了火灾检测整个过程&#xff0c;从数据集到训练模型到结果可视化分析。 博主简介 AI小怪兽&#xff0c;YOLO骨灰级玩家&#xff0c;1&#xff09;YOLOv5、v7、v8优化创新&#xff0c;轻松涨点和模型轻量化&#…

CSS 03

1.选择器 1.1 结构伪类选择器 代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>结…

Facebook:连接世界的社交巨人

在当今数字化时代&#xff0c;Facebook作为全球最大的社交媒体平台之一&#xff0c;扮演着连接世界的重要角色。它不仅仅是一个社交网站&#xff0c;更是一个数字化的社交生态系统&#xff0c;影响着全球数十亿用户的生活和交流方式。本文将深入探讨Facebook的起源、用户规模和…

MYSQL 是如何保证binlog 和redo log同时提交的?

MYSQL 一个事务在提交的时候能够保证binlog和redo log是同时提交的&#xff0c;并且能在宕机恢复后保持binlog 和redo log的一致性。 先来看看什么是redo log 和binlog&#xff0c;以及为什么要保持它们的一致性。 什么是redo log&#xff0c;binlog redo log是innodb引擎层…

如何使用“Docker registry创建本地仓库,在服务器之间进行文件push和pull”?

1.1、在服务器1&#xff0c;运行registry docker run -d -p 5000:5000 -v ${PWD}/registry:/var/lib/registry --restart always --name registry registry:2.7.11.2、编辑/etc/docker/daemon.json 文件&#xff0c; 192.168.xxx.xxx 换成你自己 registry 服务的地址 sudo na…

可视化Relay IR

目标 为Relay IR生成图片形式的计算图。 实现方式 使用RelayVisualizer可视化Relay&#xff0c;RelayVisualizer定义了一组接口&#xff08;包括渲染器、解析器&#xff09;将IRModule可视化为节点和边&#xff0c;并且提供了默认解析器和渲染器。 首先需要安装依赖&#x…

python工具方法 47 基于paddleseg将目标检测数据升级为语义分割数据

在进行项目研究时,通常需要搜集开源数据集。但是所能搜集到的数据集通常会存在形式上的差异,比如我想要的是语义分割数据,而搜集到的数据集却是目标检测数据;在这种情况下所搜集的数据就完成没有利用价值了么?不,其还存在价值,我们可以通过模型训练对数据标签的标注粒度…

网站首页添加JS弹屏公告窗口教程

很多小白站长会遇到想给自己的网站添加一个弹屏公告&#xff0c;用于做活动说明、演示站提示等作用与目的。 下面直接上代码&#xff1a;&#xff08;直接复制到网页头部、底部php、HTML文件中&#xff09; <script src"https://www.mohuda.com/site/js/sweetalert.m…

【微服务-Nacos】Nacos集群的工作原理及集群间数据同步过程

上篇文章我们介绍了Nacos集群的搭建方法及步骤&#xff0c;下面我们来看一下Nacos集群的工作原理&#xff0c;一共有两部分&#xff1a;Leader节点选举及各节点数据同步。 1、Nacos集群中Leader节点是如何产生的 Nacos集群采用了Raft算法实现。它是一种比较简单的选举算法&am…

编程四十载 - 总结了 13 条建议

原文&#xff1a;Theo Leggett - 2024.03.12 引言 10 PRINT "HELLO" 20 GOTO 10&#xff08;注&#xff1a;这段代码是 BASIC 语言&#xff0c;无限循环打印 “HELLO”&#xff09; 1984 年的 4 月&#xff0c;我的父亲为自己的家庭办公室&#xff0c;购买了一台电…

用户数据的FLASH存储与应用(FPGA架构)

该系列为神经网络硬件加速器应用中涉及的模块接口部分&#xff0c;随手记录&#xff0c;以免时间久了遗忘。 一 背景 我们知道&#xff0c;在FPGA做神经网络应用加速时&#xff0c;涉及到权重参数的存储和加载。通常在推理过程中&#xff0c;会将权重参数存储在外部DDR或片上S…

数据资产在制造行业的应用:释放潜在价值,驱动产业升级

随着信息技术的飞速发展&#xff0c;数据已成为各行各业的重要资产。在制造行业中&#xff0c;数据资产的应用更是日益广泛&#xff0c;为企业的生产、管理、决策等各个环节带来了前所未有的变革。本文将深入探讨数据资产在制造行业的应用&#xff0c;以及如何通过数据驱动实现…

C/C++中{}的用法总结(全)

C基础专栏&#xff1a;http://t.csdnimg.cn/UjhPR 目录 1.定义初始化列表&#xff08;Initializer List&#xff09; 2.类成员初始化列表 3.无默认构造函数的类的默认初始化&#xff08;C11 及以后版本&#xff09; 4.初始化器列表构造函数&#xff08;C11 及以后版本&…

HCIP —— 三层架构

企业网的三层架构 园区网络 常见的行业园区网 按照传输介质分类&#xff0c;可以将网络分为有线网络、无线网络和光纤网。 无线网络是有线网络的最后一公里。 无线网络 无线网络 --- Access Point --- 简称 AP --- 无线接入点 路由器上的WAN口:用于连接运营商的接口 路由器…

vue右键自定义样式

<!-- eslint-disable vue/no-dupe-keys --> <template><div><div class"search-box"><div class"search"><el-input placeholder"搜索" prefix-icon"el-icon-search" v-model"input2">…

STM32OLED调试工具

OLED介绍 4个引脚的oled &#xff1a; GND引脚接地&#xff0c;VCC接3.3v的电源 SCL与SDA是I2C通信的引脚 使用OLED显示屏驱动函数模块 接线图 将oled函数调试的代码引入到工程项目中 oled工程代码 OLED.C文件代码 #include "stm32f10x.h" #include "OLED_Font…

自定义方法SQL注入器-DefaultSqlInjector

/*** 自定义Sql注入* author zy*/ public class SqlInjector extends DefaultSqlInjector {Overridepublic List<AbstractMethod> getMethodList(Class<?> mapperClass, TableInfo tableInfo) {// 注意&#xff1a;此SQL注入器继承了DefaultSqlInjector(默认注入器…

Oracle 主从切换脚本

一、 切换前预检查 1. dg_precheck_main_v1.4.sh #!/bin/bash#********************************************************************************** # Author: Hehuyi_In # Date: 2022年06月16日 # FileName: dg_precheck_main_v1.4.sh # # For sys user, execute the sc…
最新文章