从 MySQL 的事务 到 锁机制 再到 MVCC

其他系列文章导航

Java基础合集
数据结构与算法合集

设计模式合集

多线程合集

分布式合集

ES合集


文章目录

其他系列文章导航

文章目录

前言

一、事务

1.1 含义

1.2 ACID

二、锁机制

2.1 锁分类

2.2 隔离级别

三、MVCC

3.1 介绍

3.2 隔离级别

3.3 原理

四、总结


前言

转眼又一年~~2023马上就要到尾声了,在最后的几天中,我想给大家分享一下 MySQL 的一些小知识。


一、事务

1.1 含义

通俗理解:在我的理解下,事务可以使 一组操作,要么全部成功,要么全部失败。事务其目的是为了下保证数据最终的一致性。

举个例子:举个例子,我给你发支付宝转了666块红包。那自然我的支付宝余额会扣减666块,你的支付宝余额会增加666块。

1.2 ACID

  • 原子性 (Atomicity)
  • 一致性 (Consistency)
  • 隔离性 (lsolation)
  • 持久性 (Durability)

原子性指的是:当前事务的操作要么同时成功,要么同时失败。原子性由undo log日志来保证,因为undo log记载着数据修改前的信息。

比如我们要 insert 一条数据了,那undo log 会记录的一条对应的 delete 日志。我们要 update 一条记录时,那undo log会记录之前的 旧值 的update记录。

如果执行事务过程中出现异常的情况那执行 [回滚]。InnoDB引擎就是利用undo log记录下的数据,来将数据 恢复 到事务开始之前。

隔离性指的是:在事务并发执行时,他们内部的操作不能互相干扰。

如果多个事务可以在同一时刻操作同一份数据,那么就会可能会产生脏读、重复读、幻读的问题。
于是,事务与事务之间需要存在 一定 的隔离。在InnoDB引擎中,定义了四种隔离级别供我们使用:

  • read uncommit(读未提交)
  • read commit (读已提交)
  • repeatable read(可重复复读)
  • serializable (串行) 

不同的隔离级别对事务之间的隔离性是不一样的 (级别越高事务隔离性越好,但性能就越低) ,而隔离性是由MySQL的各种锁来实现的,只是它屏蔽了加锁的细节。

持久性指的就是:一旦提交了事务,它对数据库的改变就应该是永久性的。说白了就是,会将数据持久化在硬盘上。

而持久性由 redo log 日志来保证,当我们要修改数据时,MySQL是先把这条记录所在的页找到,然后把该页加载到内存中,将对应记录进行修改。

为了防止内存修改完了,MySQL就挂掉了(如果内存改完,直接挂掉,那这次的修改相当于就丢失了)。

MySQL引入了 redo log,内存写完了然后会写一份 redo log,这份 redo log 记载着这次在某个页上做了什么修改。

即便 MySQL 在中途挂了,我们还可以根据 redo log来对数据进行恢复。

redo log 是顺序写的,写入速度很快。并且它记录的是物理修改 (xxxx页做了xxx修改),文件的体积很小,恢复速度也很快。

一致性指的就是:我们使用事务的目的 ,而[隔离性][原子性][持久性]均是为了保障 [一致性] 的手段,保证一致性需要由应用程序代码来保证。

比如,如果事务在发生的过程中,出现了异常情况,此时你就得回滚事务,而不是强行提交事务来导致数据不一致。 


二、锁机制

2.1 锁分类

在InnoDB引擎下,按锁的粒度分类,可以简单分为:

  • 行锁
  • 表锁

行锁实际上是作用在索引之上的。

当我们的 SQL 命中了索引,那锁住的就是命中条件内的索引节点(这种就是行锁),如果没有命中索引,那我们锁的就是整个索引树 (表锁)。

简单来说就是:锁住的是整棵树还是某几个节点,完全取决于 SQL 条件是否有命中到对应的索引节点。

而行锁又可以简单分为:

  • 读锁 (共享锁、S锁)
  • 写锁 (排它锁、X锁)

读写锁区别:

  • 读锁是共享的,多个事务可以同时读取同一个资源,但不允许其他事务修改。
  • 写锁是排他的,写锁会阻塞其他的写锁和读锁。

2.2 隔离级别

再回到隔离级别上吧,以例子来说明。

首先来说下read uncommit(读未提交)比如说: A向B转账,A执行了转账语句,但A还没有提交事务,B读取数据发现自己账户钱变多了! B跟A说,我已经收到钱了。A回滚事务[rollback]等B再查看账户的钱时,发现钱并没有多。

简单的定义就是:事务B读取到了事务A还没提交的数据,这种用专业术语来说叫做[脏读]。

对于锁的维度而言,其实就是在read uncommit隔离级别下,读不会加任何锁,而写会加排他锁。读什么锁都不加,这就让排他锁无法排它了。

而我们又知道,对于更新操作而言,InnoDB是肯定会加写锁的 (数据库是不可能允许在同一时间,更新同一条记录的)。而读操作,如果不加任何锁,那就会造成上面的脏读。

脏读在生产环境下肯定是无法接受的,,那如果读加锁的话,那意味着:当更新数据的时,就没办法读取了,这会极大地降低数据库性能。


三、MVCC

3.1 介绍

在MySQL InnoDB引擎层面,又有新的解决方案 (解决加锁后读写性能问题),叫做MVCC(Multi-Version Concurrency Control)多版本并发控制。 

在MVCC下,就可以做到读写不阻塞且避免了类似脏读这样的问题。那MVCC是怎么做的呢?

MVCC通过生成数据快照 (Snapshot)并用这个快照来提供一定级别 (语句级或事务级)的一致性读取。

3.2 隔离级别

回到事务隔离级别下,针对于 read commit (读已提交) 隔离级别,它生成的就是语句级快照,而针对于repeatable read(可重复读),它生成的就是事务级的快照。

前面提到过read uncommit隔离级别下会产生脏读,而read commit (读已提交)隔离级别解决了脏读。

思想其实很简单:在读取的时候生成一个"版本号",等到其他事务commit了之后,才会读取最新已commit的"版本号"数据。

比如说: 事务A读取了记录(生成版本号),事务B修改了记录(此时加了写锁)事务A再读取的时候,是依据最新的版本号来读取的(当事务B执行commit了之后,会生成一个新的版本号),如果事务B还没有commit,那事务A读取的还是之前版本号的数据。

通过[版本]的概念,这样就解决了脏读的问题,而通过 版本,又可以对应快照的数据。

read commit (读已提交) 解决了脏读,但也会有其他并发的问题。 [不可重复读]:一个事务读取到另外一个事务已经提交的数据,也就是说一个事务可以看到其他事务所做的修改。

不可重复读的例子: A查询数据库得到数据,B去修改数据库的数据,导致A多次查询数据库的结果都不一样[危害: A每次查询的结果都是受B的影响的]。

了解MVCC基础之后,就很容易想到repeatable read (可重复复读)隔离级别是怎么避免不可重复读的问题了 (前面也提到了)。

repeatable read (可重复复读)隔离级别是 事务级别]的快照!每次读取的都是厂当前事务的版本],即使当前数据被其他事务修改了(commit),也只会读取当前事务版本的数据。

在InnoDB引擎下的的repeatable read(可重复复读)隔离级别下,在MVCC下快照读,已经解决了幻读的问题 (因为它是读历史版本的数据)。

而如果是当前读 (比如 select * from table for update),则需要配合间隙锁来解决幻读的问题。

剩下的就是serializable (串行)隔离级别了,它的最高的隔离级别,相当于不允许事务的并发,事务与事务之间执行是串行的,它的效率最低,但同时也是最安全的。

3.3 原理

MVCC的主要是通过read view和undo log来实现的。

undo log前面也提到了,它会记录修改数据之前的信息,事务中的原子性就是通过undo log来实现的。所以,有undo log可以帮我们找到 版本]的数据。

而read view 实际上就是在查询时,InnoDB会生成一个read view,read view 有几个重要的字段,看下去就懂了。

  • trx ids (尚未提交commit的事务版本号集合)
  • low limit id (下一次要生成的事务ID值)
  • low limit id (尚未提交版本号的事务ID最小值)
  • creator_trx_id (当前的事务版本号)

在每行数据有两列隐藏的字段,分别是DB TRX ID (记录着当前ID) 以及DB ROLL PTR (指向上一个版本数据在undolog 里的位置指针)。

铺垫到这了,很容易就发现,MVCC其实就是靠[比对版本,来实现读写不阻塞,而版本的数据存在于undo log中。

而针对于不同的隔离级别 (read commit和repeatable read) ,无非就是read commit隔离级别下,每次都获取一个新的1ead view,repeatable read隔离级别则每次事务只获取一个read view


四、总结

事务、锁机制和 MVCC 是数据库管理系统中的三个核心概念,它们协同工作以确保数据的完整性和并发性。

在 MySQL 中,事务提供了一种方法来管理数据库操作的逻辑边界,锁机制用于控制对数据的并发访问,而 MVCC 则通过允许多个事务同时读取数据来提高并发性能。

了解和正确使用这些概念对于数据库管理员和开发人员来说至关重要,以确保数据库应用的性能和可靠性。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/284507.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

python使用动态规划解决不同路径问题

针对二维动态规划,还有一个问题就是关于求不同路径的实例,主要是说明在实际应用的场景中,要理解透彻实际问题的真正目的,就可以灵活实现代码编写。 对于求不同路径问题描述,对于一个机器人,处在一个mxn的网…

【Unity美术】Unity工程师对3D模型需要达到的了解【二】

👨‍💻个人主页:元宇宙-秩沅 👨‍💻 hallo 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍💻 本文由 秩沅 原创 👨‍💻 收录于专栏:Uni…

基于JavaWeb实验室预约管理系统(源码+数据库+文档)

一、项目简介 本项目是一套基于JavaWeb实验室预约管理系统,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。 包含:项目源码、数据库脚本等,该项目附带全部源码可作为毕设使用。 项目都经过严格调试,e…

【MATLAB】鲸鱼算法优化混合核极限学习机(WOA-HKELM)时序预测算法

有意向获取代码,请转文末观看代码获取方式~也可转原文链接获取~ 1 基本定义 鲸鱼算法优化混合核极限学习机(WOA-HKELM)是一种时序预测算法,它结合了鲸鱼算法和混合核极限学习机(HKELM)的优点。以下是该算法…

Ts自封装WebSocket心跳重连

WebSocket是一种在单个TCP连接上进行全双工通信的协议,允许客户端和服务器之间进行双向实时通信。 所谓心跳机制,就是在长时间不使用WebSocket连接的情况下,通过服务器与客户端之间按照一定时间间隔进行少量数据的通信来达到确认连接稳定的手…

大模型微调LoRA训练与原理

1.什么是LoRA? LoRA的全称是LOW-RANK-ADAPTATION。是一种实现迁移学习的技术手段。 2. 矩阵的秩? 秩是一个向量空间的基向量的个数。例如:二维平面坐标系存在两个基向量,平面上任意的一个向量都可以使用这两个基向量进行线性表示…

PS制作淘宝主图

PS制作淘宝主图 1.制作主图主页1.1新建800x800画板1.2填充前景色:altdel1.3选择圆角矩形,半径501.4按住ALT,往下投复制 2.调色 1.制作主图主页 1.1新建800x800画板 1.2填充前景色:altdel 1.3选择圆角矩形,半径50 居中对…

矿用以太网通讯的电缆传输可行性分析

概述 井下通讯系统是煤矿安全及生产调度必不可少的设施,近年泄露技术、小灵通技术、无线对讲技术及WIFI技术相继应用于煤矿井下。WIFI技术在地面的短距离无线通讯中已有多年的应用,相对于其他的无线宽带技术来说比较成熟可靠。 “泄露”技术及低频穿透技…

VC2019更改文件名称代码

VC2019更改文件名称代码 效果代码 效果 华为手机拍摄的视频默认名称是“VID_20231213_111723”,图片名称是“IMG_20231213_111723”,需要批量将“VID”改为“IMG” 代码 代码(C#): csharpStringBuilder sbnew StringBuilder()…

ROS TF坐标变换 - 静态坐标变换

目录 一、静态坐标变换(C实现)二、静态坐标变换(Python实现) 如前文所属,ROS通过广播的形式告知各模块的位姿关系,接下来详述这一机制的代码实现。 模块间的位置关系有两种类型,一种是相对固定…

使用spring boot实现异常的统一返回

在这个前后端分离的时代,一个 统一的数据格式非常重要。本次我们实现用spring boot实现一下返回给前端数据的统一格式,不再出现服务器500的错误。 新建一个spring boot项目,并导入knife4j的依赖。 写一个controller控制器,用来是…

Vue中全局事件总线的配置和原理

实现任意组件之间的通信 任意组件通信的原理: 1、实现任意组件之间的通信,需要一个傀儡。这个傀儡既能被vm访问到,也能被VueComponent访问。 2、VueComponent.prototype.proto Vue.prototype为图上1.0黄色的线路。是Vue让组件实例对象VueComponent可以访问到Vue原…

将学习自动化测试时的医药管理信息系统项目用idea运行

将学习自动化测试时的医药管理信息系统项目用idea运行 背景 学习自动化测试的时候老师的运行方式是把医药管理信息系统项目打包成war包后再放到tomcat的webapp中去运行,于是我想着用idea运行会方便点,现在记录下步骤方便以后查找最开始没有查阅资料&am…

【栈】根据模式串构造最小数字

import java.util.ArrayDeque; import java.util.Deque;/*** 思路:如果是字符‘I’直接对应的数字加入结果res中,如果是‘D’将对应的数字加入栈中。* 再次遇到‘I’先将对应的数字加入结果res中,然后再将栈中的元素从栈顶取出存放在* …

simulink代码生成(五)——ePWM模块初级应用

前面分别讲到了SCI及ADC的配置及使用,现在梳理一下ePWM的配置和使用; 先打一些基础的DSP28335的基础知识; F28335 关于ePWM中断与SOC采样信号的一些思考_socasel-CSDN博客 F28335 ePWM模块简介——TMS320F28335学习笔记(四&…

受“博比特虫”启发可实现多模态传感抓取动作的软执行器来了

软执行器可以实现对易碎和不规则形状物体的精细自适应抓取,这在生物和工程系统中至关重要。然而,目前软机器人在抓取的时候往往受制于抓取能力不足和功能限制。 博比特虫捕获猎物 最近研究人员提出了一种受博比特虫启发的多模态传感自适应软抓取器&…

simulink代码生成(六)——多级中断的配置

假如系统中存在多个中断,需要合理的配置中断的优先级与中断向量表;在代码生成中,要与中断向量表对应;中断相关的知识参照博客: DSP28335学习——中断向量表的初始化_中断向量表什么时候初始化-CSDN博客 F28335中断系…

sscanf的简介

sscanf 函数的原型: 第一个函数参数 const char * 表示字符串 (类似于scanf)第二个函数参数表示 格式 ​​​​​​​ ​​​​​​​ 第三个函数参数 首先sscanf函数可以用于以下几种情况: 分离数字: #i…

Java开发过程中的幂等性问题

幂等性问题: 1. 有时我们在填写某些 form表单 时,保存按钮不小心快速点了两次,表中竟然产生了两条重复的数据,只是id不一样。 2. 我们在项目中为了解决 接口超时 问题,通常会引入了 重试机制 。第一次请求接口超时了…

2023年“中银杯”四川省职业院校技能大赛“云计算应用”赛项样题卷①

2023年“中银杯”四川省职业院校技能大赛“云计算应用”赛项(高职组) 样题(第1套) 目录 2023年“中银杯”四川省职业院校技能大赛“云计算应用”赛项(高职组) 样题(第1套) 模块一…
最新文章