Mysql的sql优化

一.查询优化

我们都知道,在建立索引的时候,要考虑where后面的查询条件字段、order by 排序后面的字段 、group by 分组排序后面的字段,对他们的字段建立合适的索引,但是我们需要思考怎么建立合适的索引,或者建立索引之后怎么合理使用呢?

1.1 where 条件优化

where后面的查询条件字段优化参考:Mysql的索引数据结构、sql性能分析工具、索引使用和设计原则

1.2 order by 优化

Using filesort:通过表的索引或全表扫描,读取满足条件的数据行,然后在排序缓冲区sort buffer中完成排序操作,所有不是通过索引直接返回排序结果的排序都叫FileSort排序。
Using index:通过有序索引顺序扫描直接返回有序数据,这种情况即为using index,不需要额外排序,操作效率高
显然第二种排序性能要比第一种性能好。
我们在创建索引时,如果没有指定索引的升序还是降序排列,创建的索引默认是升序排列的。
接下来我将举一个例子来说明,假如有一个sys_user表,先执行以下语句,查看表中建立了哪些索引:

show index from sys_user;

执行结果如下:
在这里插入图片描述
现在我们查询用户,根据username排序,sql如下:

explain select id, username from sys_user order by username;

执行结果如下:
在这里插入图片描述
这时我们为email和phone两个字段创建一个联合索引,来测试一下效果,执行以下sql:

create index idx_su_email_phone on sys_user(email, phone);
show index from sys_user;

执行结果如下,可见联合索引创建成功,并且2个字段都是升序建立的索引:
在这里插入图片描述
现在通过不同的排序sql,来看以下执行结果:

查询以下4个字段,但是password是没有建立索引的
explain select id, email, phone, password from sys_user order by email, phone

执行结果如下:
在这里插入图片描述
出现以上的原因就是因为没有覆盖索引,覆盖索引的意思就是你查询的字段已经全部建立了索引。

查询以下3个字段,都是建立的索引
explain select id, email, phone, password from sys_user order by email, phone

查询结果如下:
在这里插入图片描述

还是查询以下3个字段,都建立索引,只是排序的时候都指定asc
explain select id, email, phone from sys_user order by email asc , phone asc

执行结果如下:
在这里插入图片描述

还是查询以下3个字段,都建立索引,只是排序的时候email指定asc,phone指定desc
explain select id, email, phone from sys_user order by email asc , phone desc

执行结果如下:
在这里插入图片描述

还是查询以下3个字段,都建立索引,只是排序的时候email指定desc,phone指定asc
explain select id, email, phone from sys_user order by email desc , phone asc

执行结果如下:
在这里插入图片描述

还是查询以下3个字段,都建立索引,只是排序的时候email指定desc,phone指定desc
explain select id, email, phone from sys_user order by email desc , phone desc

执行结果如下:
在这里插入图片描述

order by 总结:
1.根据排序字段建立合适的索引,多字段排序时,也遵循最左前缀法则;
2.尽量使用覆盖索引;
3.多字段排序,一个升序,一个降序,此时需要注意联合索引在创建时的规则;
4.如果不可避免的出现filesort,大数据量排序时,可以适当增大排序缓冲区的大小 sort_buffer_size(默认256k)

1.3 group by 优化

在平时开发之中我们经常使用group by进行分组统计,那么我们需要思考group by的工作原理是什么呢,以及性能瓶颈的时候,我们应该怎么进行优化呢?
在讲解之前,我们先看一下下面的例子:
假如有一个如下的用户表,我们需要统计每个省份多少人
在这里插入图片描述
执行以下sql:

select province, count(*) from user group by province

执行结果如下:
在这里插入图片描述
我们先用explain查看一下执行计划(Mysql的索引数据结构、sql性能分析工具、索引使用和设计原则):

explain select province, count(*) from user group by province

执行结果如下:
在这里插入图片描述Extra 这个字段的Using temporary表示在执行分组的时候使用了临时表、Using filesort表示使用了排序
group by 怎么就使用到临时表和排序了呢?我们来看下这个SQL的执行流程。
上面使用group by的语句执行流程如下:
1.创建内存临时表,表里有两个字段province和count;
2.全表扫描user的记录,依次取出city = 'X’的记录。
3.判断临时表中是否有为 city='X’的行,没有就插入一个记录 (X,1);
4.如果临时表中有city='X’的行的行,就将x 这一行的num值加 1;
5.遍历完成后,再根据字段city做排序,得到结果集返回给客户端。
如下图所示的执行流程:
在这里插入图片描述
在这里我们需要思考以下几个问题:

1. group by一定要配合聚合函数一起使用嘛?
2. group by的字段一定要出现在select中嘛?
3. group by导致的慢SQL问题如何优化和解决?

问题1:group by 就是分组统计的意思,一般情况都是配合聚合函数如(count(),sum(),avg(),max(),min())一起使用。
count() 数量
sum() 总和
avg() 平均
max() 最大值
min() 最小值
如果没有配合聚合函数使用可以吗?
我用的是Mysql 5.7 ,是可以的。不会报错,并且返回的是,分组的第一行数据。
比如下面的语句:

select id, name, age from user group by province;

执行结果如下:
在这里插入图片描述
从上面的结果可以看出返回的数据条数只有4条,但实际是远远大于4条,是因为上面返回的是分组之后,每组的第一条数据。

问题二:比如上面的那个sql,group的字段没有出现在select中,是不会有问题的,当然不同的数据库版本不一样。

问题三:group by使用不当,很容易就会产生慢SQL 问题。因为它既用到临时表,又默认用到排序。有时候还可能用到磁盘临时表。如果执行过程中,会发现内存临时表大小到达了上限(控制这个上限的参数就tmp_table_size,会把内存临时表转成磁盘临时表。如果数据量很大,很可能这个查询需要的磁盘临时表,就会占用大量的磁盘空间。
我们可以从两个方向上去优化,1.在业务不需要分组排序的时候,在分组的时候我们不进行排序;2.不使用临时表。
我们可以在groub by 后面加上 order by null 就不会进行排序,sql如下:

 explain select province, count(*) as num from user group by province order by null

如下图执行计划结果,extra 没有Using filesort, 只有Using temporary,表示走了临时表,没有走排序了。
在这里插入图片描述

我们一起来想下,执行group by语句为什么需要临时表呢?group by的语义逻辑,就是统计不同的值出现的个数。如果这个这些值一开始就是有序的,我们是不是直接往下扫描统计就好了,就不用临时表来记录并统计结果啦?
解决办法是在,group by 后面的字段加索引,如下图所示的sql,给province字段先加上索引:

create index idx_u_province on user (province)

使用如下语句查看user表建立的索引:

show index from user;

执行结果如下, 给province字段加上了索引:
在这里插入图片描述
此时,我们在使用下面sql语句执行:

explain select province, count(*) as num from user group by province

执行计划如下:
在这里插入图片描述
此时的extra只有using index, 走了索引,没有走临时表和缓冲排序了。

group by 优化总结:
1.如果group by 后面的字段没有加索引,一般会走临时表和默认使用排序;
2.如果没有排序的要求,我们可以使用order by null 不进行排序,此时只走临时表;
3.我们在建立索引的时候,尽量把group by 后面的字段考虑进来,并且是考虑覆盖索引,就是建立组合索引的时候select后面的字段跟group by 后面的字段保持一致。

1.4 count优化

对于count计数来说,执行以下语句,针对不同的存储引擎,count执行效率不一样

explain select count(*) from tb_user;

MyISAM:把一个表的总行数存在了磁盘上,因此执行count() 的时候回直接返回这个数,效率很高;
InnoDB:在执行count(
)的时候,需要把数据一行一行地从引擎里面读出来,然后累积计数。
优化思路:自己计数,用redis,每次执行插入操作的时候,就进行+1
count的几种用法及哪个性能高
count(主键值):InnoDB引擎会遍历整张表,把每一行的主键id值取出来,返回给服务层。服务层拿到主键后,直接按行进行累加(主键不可能为null)。
count(字段):没有not null 约束:InnoDB引擎会遍历整张表把每一行的字段值取出来,返回给服务层,服务层判断是否为null,不为null,计数累加;有not null约束,InnoDB引擎会遍历整张表把每一行的字段值取出来,返回给服务层,直接按行进行累加。
count(1):InnoDB引擎遍历整张表,但不取值。服务层对于返回的每一行,放一个数字’1’进去,直接按行进行累加。
count():InnoDB并不会把全部字段取出来,而是专门做了优化,不取值,服务层直接按行进行累加。
count(
)>count(1)>count(主键)>count(字段)

二. 插入数据

批量插入
对于有多条数据的插入的情况,采用批量插入的方式,因为进行一次插入操作就会连接一次数据库,如果不一次性插入就会有大量的连接数据库的IO操作,耗时,会很慢,一般在mapper.xml中批量插入的语法如下:

    <insert id="方法名" >
        INSERT INTO 表明
            (字段1,字段2,字段3,....)
        VALUES
        <foreach collection="req" item="item" separator=",">
            (#{item.字段值1}, #{item字段值2}, #{item.字段值3}, ...)
        </foreach>
    </insert>

手动提交事务

start transaction;
insert into ...........;
insert into ...........;
insert into ............;
commit;

因为mysql插入一条数据就会提交一次事务,如果有多条,就要执行多条提交事务的操作,所以进行手动提交事务,数据插入完成之后在提交事务。

三. 主键优化

主键设计原则:
1.满足业务需求的情况下,尽量降低逐渐的长度。
2.插入数据时,尽量选择顺序插入,选择使用AUTO_INCREMENT自增主键;
3.尽量不要使用UUID做主键或者其他自然主键,如身份证号,应为太长,会占用大量

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/376906.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

计算机网络-华为无线网络配置

前面已经大致了解了无线通信的原理和无线组网的概念&#xff0c;今天来学习无线的配置过程与步骤。 一、无线组网配置流程 在开始配置前复习下前面讲过无线组网有涉及几个设备&#xff0c;AC无线控制器、AP无线接入点、POE交换机。无线组网与有线组网是相对独立的&#xff0c;不…

10:LED点阵显示汉字

LED点阵显示汉字 1、字模2、横向取模 1、字模 (1)如何记录组成字的LED点阵亮灭信息&#xff08;16x16点阵一共有256点&#xff0c;显示一个特定的字需要其中有些点亮而另一些不亮&#xff0c;如何记录哪些点亮哪些点不亮&#xff1f;用字模)字模如何工作&#xff1f;256个点用…

机器学习 | 揭示EM算法和马尔可夫链的实际应用

目录 初识EM算法 马尔可夫链 HMM模型基础 HMM模型使用 初识EM算法 EM算法是一种求解含有隐变量的概率模型参数的迭代算法。该算法通过交替进行两个步骤&#xff1a;E步骤和M步骤&#xff0c;从而不断逼近模型的最优参数值。EM算法也称期望最大化算法&#xff0c;它是一个基…

负重20kg复合翼垂直起降无人机应用,复合翼无人机技术分析

主要任务应用 1.管线巡查 挂载可见光/红外二合一光电载荷和小型SAR设备&#xff0c;对既定线路进行昼夜巡视侦察&#xff0c;利用图像实时传回指挥控制中心&#xff0c;可用于石油管路、电力线路、舰艇航线及周围态势感知&#xff0c;利于依据现场实情进行战略决策和指令传达…

车载网络测试 - 总线基础 - CAN总线负载计算

我想做过CAN总线测试的都有遇到过拉高总线负载相关的测试&#xff0c;这个时候我们一般都会通过增加报文的数量或者减小报文的周期来实现&#xff0c;但是CAN总线上的负载到底是如何计算的呢&#xff1f;我想很多人都会有这个疑问吧&#xff0c;那么今天我们一起来看下如何计算…

10. Springboot集成Dubbo3(一)简单介绍

目录 1、前言 2、Dubbo3 2.1、什么是Dubbo3 2.2、Dubbo2 & Dubbo3 2.2.1、服务发现模型 2.2.2、RPC通信协议 2.2.2.1、Triple 协议 2.2.2.2、小结 2.2.3、云原生 2.2.4、maven依赖 2.2.5、性能 3、小结 1、前言 Dubbo是一个开源的Java分布式服务框架&#xff…

ProtonMail邮箱怎么样?国内有什么替代品?

ProtonMail作为业界知名的加密邮箱提供者&#xff0c;其安全性、隐私保护等特性让不少追求私密通信的用户趋之若鹜。然而对于国内用户而言&#xff0c;ProtonMail可能并非最佳选择&#xff0c;受限于许多因素&#xff0c;从语言支持到服务器位置再到可访问性&#xff0c;都可能…

个人博客说明

本人博客主要发布平台为博客园 https://www.cnblogs.com/carmi 更多详细&#xff0c;完整图片的文章还请师傅们动动小手到博客园去看吧。

泰克示波器——TBS2000系列界面整体介绍

目录 1.1 通道区域面板标识1.2 示波器测试输出&#xff08;检测探针与设置的好坏&#xff09;1.3 面板其他快捷按钮1.4 波器整体界面 1.1 通道区域面板标识 在通道面板的下方标识有示波器的通道属性以及参数值&#xff0c;如我使用的型号为“TBS2104X”的示波器&#xff0c;面…

【C#】.net core 6.0 设置根目录下某个文件夹可访问,访问创建的图片等资源

欢迎来到《小5讲堂》 大家好&#xff0c;我是全栈小5。 这是《C#》系列文章&#xff0c;每篇文章将以博主理解的角度展开讲解&#xff0c; 特别是针对知识点的概念进行叙说&#xff0c;大部分文章将会对这些概念进行实际例子验证&#xff0c;以此达到加深对知识点的理解和掌握。…

精酿啤酒:啤酒的后熟与包装过程的品质保障

啤酒的后熟与包装过程是确保产品品质的重要环节。对于Fendi Club啤酒来说&#xff0c;这一环节同样关键&#xff0c;它关系到啤酒的口感、风味和保质期的长短。 在啤酒的后熟过程中&#xff0c;Fendi Club啤酒酿造团队采用适当的温度和时间控制&#xff0c;让啤酒逐渐发展出更加…

ElastAlert 错误日志告警

文章目录 前言一、ElastAlert 概览1.1 简介1.2 ElastAlert 特性 二、ElastAlert 下载部署2.1 安装 Python3 环境2.2 下载 ElastAlert2.3 部署 ElastAlert 三、接入平台3.1 对外接口层3.2 服务层 前言 ElastAlert 是 Yelp 公司基于 python 开发的 ELK 日志告警插件&#xff0c;…

幻方(Magic Square)

幻方&#xff08;Magic Square&#xff09; 幻方概述 什么是幻方呢&#xff1f;幻方&#xff08;Magic Square&#xff09;就是指在nn&#xff08;n行n列&#xff09;的方格里填上一些连续的数字&#xff0c;使任意一行、任意一列和对角线上的数字的和都相等。例如有33的3行3…

【Linux】gdb调试与make/makefile工具

目录 导读 1. make/Makefile 1.1 引入 1.2 概念 1.3 语法规则 1.4 示例 2. Linux调试器-gdb 2.1 引入 2.2 概念 2.3 使用 导读 我们在上次讲了Linux编辑器gcc\g的使用&#xff0c;今天我们就来进一步的学习如何调试&#xff0c;以及makefile这个强大的工具。 1. mak…

VLAN间通信

VLAN间通信的三种方法 vlanif接口 最常用&#xff0c;又叫虚拟接口&#xff0c;这种方式一般使用三层交换机实现&#xff0c;它包含路由模块和交换模块&#xff0c;交换模块可以实现剥离和添加VLAN标签,路由模块实现路由功能 VLANif接口 为各自vlan的网关 # interface Vlani…

Page246~250 11.1GUI下的I/O基础

11.1.1 从“控制台”说起 “命令行交互界面”&#xff08;简称CUI,也有人称为CLI)。 CUI需要我们记忆并在控制台输入命令文本内容&#xff0c;而GUI则以图形的方式呈现、组织各类命令&#xff0c;比如Windows的“开始”菜单&#xff0c;用户只需通过简单的键盘或鼠标操作&am…

跳格子3 - 华为OD统一考试

OD统一考试&#xff08;C卷&#xff09; 分值&#xff1a; 200分 题解&#xff1a; Java / Python / C 题目描述 小明和朋友们一起玩跳格子游戏&#xff0c; 每个格子上有特定的分数 score [1, -1, -6, 7, -17, 7]&#xff0c; 从起点score[0]开始&#xff0c;每次最大的步…

YOLO部署实战(2):使用OpenCV优化视频转图片流程并设置帧数

在计算机视觉和图像处理领域&#xff0c;OpenCV是一个强大的开源库&#xff0c;它为处理图像和视频提供了丰富的工具和功能。本文将介绍如何使用OpenCV将视频文件转换为一系列图片&#xff0c;并演示如何通过设置转换的帧数来优化这一过程。 1 Win10配置OpenCV 在Windows操作…

【Linux】基于管道进行进程间通信

进程间通信 一、初识进程间通信1. 进程间通信概念2. 进程间通信分类 二、管道1. 管道概念2. 管道原理3. 匿名管道4. 匿名管道系统接口5. 管道的特性和情况6. 匿名管道的应用&#xff08;1&#xff09;命令行&#xff08;2&#xff09;进程池 7. 命名管道&#xff08;1&#xff…

c++阶梯之类与对象(中)< 续集 >

前文&#xff1a; c阶梯之类与对象&#xff08;上&#xff09;-CSDN博客 c阶梯之类与对象&#xff08;中&#xff09;-CSDN博客 前言&#xff1a; 在上文中&#xff0c;我们学习了类的六个默认成员函数之构造&#xff0c;析构与拷贝构造函数&#xff0c;接下来我们来看看剩下…