完蛋! 我被MySQL索引失效包围了!

前言

一阵熟悉的起床闹钟响起,小菜同学醒来竟发现周围都是导致索引失效的原因:性感迷人的索引使用不当、可爱活泼的存储引擎无法识别索引列、刁蛮任性的优化器不选择索引...

知其然更要知其所以然,一起来看看索引为啥失效了吧~

在阅读文本前,需要知道聚簇索引、二级索引、回表等知识,如果同学不太了解可以去查看往期文章~

什么是索引失效呢?

对于MySQL常使用的索引来说,往往是聚簇索引和二级索引

索引失效指的是在某些场景下,MySQL不使用二级索引,而去使用聚簇索引(全表扫描),从而导致二级索引失效 (索引失效中的索引指的是二级索引)

不够熟悉索引导致使用不当

索引使用不当往往是因为我们不够了解索引

在聚簇索引中,记录按照主键值升序排序

在二级索引中,记录按照索引列、主键的顺序升序排序,当索引列相等时主键才有序

image.png

在(age,student_name)联合索引中,当age相等才对student_name排序,当student_name相等才对主键id排序

当我们熟悉索引存储规则之后,就可以有效避免索引使用不当的情况

比如 select * from student where student_name like 'c%' 是用不上(age,student_name)联合索引的

当查找的列不是有序的就可能会扫描整个二级索引,而这种情况下还可能要回表,因此MySQL会放弃使用二级索引,直接扫描聚簇索引,从而导致索引失效

当我们建立student_name索引后,上述SQL即可使用student_name二级索引

如果将SQL改为select * from student where student_name like '%c%' 也会导致无法使用索引

原因与上面说的类似,左模糊查询导致无法预估要扫描的区间,从而造成全表扫描

其他类似的场景还有order bygroup by等需要排序场景,使用的二级索引不具备有序从而导致索引失效

当我们熟悉索引后一般场景下是不会犯这种索引使用不当的小错误~

存储引擎层导致索引失效

当执行器携带查询条件向存储引擎层请求数据时,如果存储引擎层无法识别数据也会导致无法使用索引

表达式

比如在查询条件中使用表达式 where age + 2 = 10

存储引擎层的innodb无法识别表达式时也会导致索引失效

image.png

当然我们一般不会采取这种写法(key_len = 3说明只用到联合索引中的age)

函数

当我们对索引列使用函数时,存储引擎层也无法识别

比如 explain select * from student where age = '8' limit 1000 会隐式使用函数将'8'由字符串转换为整形8

等同于该SQL SELECT * FROM student WHERE age = CAST('8' AS UNSIGNED) LIMIT 1000 这种情况下是可以使用索引的

当对索引列age使用函数时如:SELECT * FROM student WHERE CAST(age AS CHAR) = '8' LIMIT 1000

存储引擎层无法识别CAST(age AS CHAR)导致无法使用age相关的索引

image.png

隐式使用函数进行类型转换也是容易导致索引失效的一种场景

即使字段类型相同也有可能发生隐式类型转换,比如 utf8(mb3) 向 utf8mb4 进行转换

在联表查询中,一般会为被驱动表的关联条件建立索引加速查询

 select a2,b1 from  a 
 left join b on a.a2 = b.b2

比如在这个SQL中b为被驱动表,为关联条件需要的b2建立索引可以加快查询

image.png

正常情况下会使用索引(上图)

但是同样的SQL,你知道什么情况下会变成下图这样吗?

image.png

虽然用上了索引但没完全用上,还是使用了join buffer,从前后的key_len也可以知道没完全用上

原因就是当a2字段的字符集为uft8mb4、b2为utf8时,从驱动表a获取记录去被驱动表b中获取,b2字段隐式使用函数转换为utf8mb4导致存储引擎无法识别

菜菜就因为这种情况在本地没问题,结果生产上字符集不同导致索引失效

Server层导致索引失效

另一种索引失效的场景发生在server层:当优化器认为使用该索引成本太大则会偏向使用全表扫描

回表太多

那么啥情况会让优化器认为使用二级索引成本大呢?

使用二级索引时往往是需要回表导致成本大

因为回表不止需要多查询一个聚簇索引,由于二级索引的主键值可能无序查询聚簇索引时还会导致随机IO

回表成本大的场景一般发生在查询数据量较大的情况下,因为回表的数据增多成本也就变大

MySQL认为使用二级索引成本太大从而导致索引失效

比如or、is null、is not null等查询条件并不一定会导致索引失效,当MySQL预估它们的数据量太大回表开销太高时才会放弃使用二级索引

又或者是深分页问题 limit 10000000,10,由于MySQL要在server层进行limit,那就会导致先查前一千万条数据,而使用查的数据量太大,如果需要回表成本就会非常高,从而导致深分页问题的索引失效

估算误差用错索引

当MySQL估算成本估算错误时也可能导致索引失效

当需要扫描的记录数量超过一定限制(show variables like 'eq_range_index_dive_limit')时,会使用统计的方式预估成本容易有误差(空闲时使用analyze table 重新统计cardinality)

cardinality用于判断重复值,越小说明重复值越多,如果重复值太多(cardinality太小),也会让MySQL不偏向使用索引

总结

索引失效大致分为3种场景:索引使用不当、存储引擎层导致索引失效、Server层导致索引失效

不熟悉索引存储规则,在使用时就容易造成索引使用不当,如:左模糊匹配、联合索引最左匹配原则、order by、group by排序等

当存储引擎层无法识别查询条件中的索引列时会导致索引失效,如:索引列使用表达式、显示/隐式使用函数等

当Server层优化器认为使用二级索引成本太大时会导致索引失效,成本的主要来源是回表,回表数据量太大就会导致成本高而不偏向使用索引,如深分页问题等(重复值太多也会导致不偏向使用索引)

当需要扫描的记录数量超过一定限制,使用统计预估成本会造成误差,误差过大也会造成索引失效

最后(不要白嫖,一键三连求求拉~)

小菜同学熟悉各种场景导致的索引失效后,准备将周围的索引失效场景一一攻略

一阵熟悉的起床闹钟响起,小菜同学满头大汗的爬起:原来只是一场梦,还好项目里没有这么多索引失效的场景

本篇文章被收入专栏 由点到线,由线到面,构建MySQL知识体系,感兴趣的同学可以持续关注喔

本篇文章笔记以及案例被收入 gitee-StudyJava、 github-StudyJava 感兴趣的同学可以stat下持续关注喔~

有什么问题可以在评论区交流,如果觉得菜菜写的不错,可以点赞、关注、收藏支持一下~

关注菜菜,分享更多干货,公众号:菜菜的后端私房菜

本文由博客一文多发平台 OpenWrite 发布!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/156922.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

零基础安装分布式数据服务注册系统

一、先安装VM虚拟机,安装最新的ubuntu22系统, 先安装mysql, sudo apt install mysql-server sudo mysql_secure_installation 根据自己需求选择 密码安全级别时,选择n 删除匿名用户?(按y|Y表示是&…

【加载自定义数据csv/image】HuggingFace的datasets库中load_dataset

1.加载自定义数据 load_dataset有以下参数,具体可参考 源码 def load_dataset(path: str,name: Optional[str] None,data_dir: Optional[str] None,data_files: Union[Dict, List] None,split: Optional[Union[str, Split]] None,cache_dir: Optional[str] No…

UE基础篇十一:Sequencer

导语: 视频文档在文末 知识点记录: 1、创建Sequence 2、动画可以设置权重值 作动画过渡 3、摄像机 可以设置追踪目标 调整一些摄像机参数等 4、在曲线编辑中编辑可以更详细调整路径 5、在一个序列中 添加添加另一个序列文件

git commit 后 发现提交信息写错了怎么办

解决方案: 可以使用 git commit --amend 命令。此命令将打开默认文本编辑器,允许你编辑最近的提交的提交信息。 以下是使用 git commit --amend 的步骤: 首先,在你的工作目录中进行所需的更改。运行 git add 命令将更改的文件添…

恒驰喜讯 | 荣获2023项目管理论坛“最佳集成服务伙伴”、“卓越合作伙伴项目经理”双奖

2023年11月7日~8日,以“价值交付共创未来”为主题的2023年项目管理论坛在深圳坂田成功举办。论坛上,来自海内外交付领域的200多名专家围绕项目管理实践、交付案例与项目优化等主题展开了深入交流,并就各区域项目管理案例做了经验分享&#xf…

ubuntu20.04.6安装Intel AX211网卡驱动

前言 环境: ThinkBook16 2023 款网卡Intel AX211 Wi-Fi6ubuntu版本20.04.6(最后一位小数很重要)系统内核 Linux wzy 5.15.0-67-generic #74~20.04.1-Ubuntu SMP Wed Feb 22 14:52:34 UTC 2023 x86_64 x86_64 x86_64 GNU/Linux 方法&#x…

分布式事务 - seata安装

分布式事务 - seata 一、本地事务与分布式事务 1.1、本地事务 本地事务,也就是传统的单机事务。在传统数据库事务中,必须要满足四个原则(ACID)。 1.2、分布式事务 分布式事务,就是指不是在单个服务或单个数据库架构…

粉够荣获淘宝联盟理事会常务理事,共绘联盟生态新篇章

淘宝联盟区域理事会于2021年成立,首届成立成都、广州、武汉,服务近2000个领军淘宝客企业,作为区域生态与官方交流重要枢纽,理事会举办近百场交流分享会,带动淘客跨域跨业态交流成长。 2023年9月7日第二届淘宝联盟理事…

React实战项⽬开发完整流程含代码

React实战演练项⽬一需求分析及项目初始化 需求分析 刚学完React,开始找项目进行上手练习! 页面组件拆分: 头部:导航tab、搜索框、登录注册 中间:分类导航、轮播图、新人福利、高单价产品导航 课程分类列表、底部内容、登陆提…

MinIO实现数据迁移(mc)

运行两个版本的minio version: 2.3 services: # 新版本 minio2023: image: minio/minio:RELEASE.2022-06-20T23-13-45Z.fips container_name: minio2023 restart: always environment: - MINIO_ACCESS_KEYminioadmin - MINIO_SECRET_KEYminioadmin - MINIO_ROOT_USERminioadm…

为什么要使用动态代理IP?数据采集使用动态代理有哪些优势?

随着互联网的普及,数据采集已经成为企业、营销人员和数据分析师的重要工作之一。然而,在采集数据的过程中,经常会遇到一些问题,如IP被封禁、访问受限等。为了解决这些问题,动态代理IP应运而生。那么,为什么…

TP-LINK联洲面试题

文章目录 1.说一下微服务架构?2.微服务优缺点3.负载均衡的实现算法4.Redis集群部署方式?5.MySQL主从复制?5.1 配置流程5.2 优缺点分析6.口头手撕快排7.队列实现栈和栈实现队列7.1 队列实现栈7.2 栈实现队列8.进程有几种状态?9.Spring Boot Actuator?10.外键、主键和索引?…

数字化转型具体包含哪些内容?

数字化转型是一个广泛且多方面的过程,涉及将数字技术集成到组织或企业的各个方面,从根本上改变其运营和交付价值的方式。它包含广泛的活动、战略和举措,这些活动、战略和举措可能会根据组织的具体目标和需求而有所不同。以下是数字化转型的一…

谁家分析数据还要开发啊,不都一键得报表吗?

点击导入数据,再回来BI系统已经把近百张数据分析报表放在眼前了,每月都要计算分析的指标有了,领导要的数据分析有了,自己要的业绩分析也有了,甚至自己没想到的一些分析主题,它也贴心地做好了。有这样一套BI…

微信抽奖活动怎么做

微信抽奖活动:打破传统,创新互动,带给你超乎想象的惊喜体验! 随着互联网的飞速发展,人们越来越热衷于参与各种线上活动。而微信,作为中国最大的社交平台之一,自然成为了各种活动的聚集地。今天…

什么是CDN?什么是安全加速CDN?有什么优势?

安全加速CDN(Content Delivery Network)是一种网络架构,它通过在全球范围内部署服务器并缓存静态和动态内容来提供更快的Web页面加载和更好的用户体验。安全加速CDN可以保护网站免受DDoS攻击、恶意软件和其他安全威胁,从而提高网站的可用性和稳定性。它通…

Python武器库开发-flask篇之Get与Post(二十五)

flask篇之Get与Post(二十五) 在Flask中通过request对象请求相关的数据,在正常的网页请求的过程中,有两种请求的方式,Get和Post Get请求 我们现在来看看在Flask中是如何以Get方式得到我们想要的值的,通过request.args可以获取Get请求中的所…

QT 使用mysql

版本:ubuntu:20.04.1 mysql: 8.0.35 QT :5.12.8 1.安装mysql sudo apt install mysql-server 下载完后查看mysql状态 sudo service mysql status 如下图active(running)则下载成功,运行中…

蓝牙运动耳机哪个好?适合运动时戴的蓝牙耳机有哪些?

​在各式各样的耳机当中,运动耳机可以说是使用场景最广的一类了。毕竟运动耳机对于某些方面性能要求会比非运动耳机要高很多,就比如户外运动、健身、骑行等方面。面对这么多运动耳机,哪款更值得入手?今天就来给大家推荐几款很不错…
最新文章