浅谈MySQL为什么会选错索引_Mysql

浅谈MySQL为什么会选错索引

2023-03-21 14:46XHHP Mysql

本文主要介绍了浅谈MySQL为什么会选错索引，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

1.引例

首先创建一张表，并对字段a，b分别建立索引：

create table t (
id int(11) not null,
a int(11) default null,
b int(11) default null,
primary key (id),
key a(a),
key b(b)
)engine=InnoDB;

然后往表中，插入十万行数据，值按整数递增：(1,1,1)、(2,2,2)、(3,3,3)…

delimiter ;;
create PROCEDURE insertdata()
begin
declare i int;
set i=1;
while(i<=100000) DO
insert into t values(i,i,i);
set i = i+1;
end while;
end;;
delimiter ;
call insertdata();

接下来，我们执行一条sql：

mysql >explain select * from t where a between 10000 and 20000;

执行结果：

浅谈MySQL为什么会选错索引

结果中的“key”字段就代表了查询中使用的索引。所以这条语句走了索引a，没什么问题。

我们再来执行如下操作：

浅谈MySQL为什么会选错索引

但是这个时候session B的查询语句select * from t where a between 10000 and 20000就不会再选择索引a。

为了比较使用索引和不使用的查询性能对比，执行下面的语句：

set long_query_time=0;
select * from t where a between 10000 and 20000;
select * from t force(a) where a between 10000 and 20000;

下面是两种慢查询日志中的结果对比：

浅谈MySQL为什么会选错索引

第一个查询查找了十万行，第二个查询走了索引，查找了一万行，速度明显比较快。

那为什么会选错索引呢？

2.优化器的逻辑

选择索引是优化器的工作，优化器选择索引的目的，就是想要找到一个最优的执行方案，并用最小的代价去执行。

在数据库里面，扫描行数是影响执行代价的因素之一。扫描行数越少，意味着访问磁盘次数越少。但是扫描行数并不是唯一的评价标准，还会考虑临时表，是否排序等因素。

那扫描行数是如何判断的？ MySQL在真正执行之前，只能根据统计信息来估算记录数。这个统计信息就是索引的“区分度”。 一个索引上不同的值越多，这个索引的区分度就越好。而一个索引上不同的值的个数，我们称之为“基数”(cardinality)。也就是说，这个基数越大，索引的区分度越好。

我们可以用show index的方法看到不同索引的基数值,但是可以看到统计信息并不是太准确。 可以使用analyze table t来重新统计，但是也不一定准确。

浅谈MySQL为什么会选错索引

那MySQL是如何得到索引的基数呢？ 答案是MySQL会采取采样统计的方法，默认会选择N个数据页，统计这些页面上的不同值，得到平均值，再乘以总的页面数。

在MySQL中，有两种存储索引统计的方式，可以通过设置innodb_stats_persisten来设置：

设置为on的时候，表示统计信息会持久化存储。这时，默认的N是20，M是10
设置为off的时候，表示统计信息只存储在内存中。这时，默认的N是8，M是16

我们再来比较两个语句预估的查询行数，如下图：

浅谈MySQL为什么会选错索引

图中的row字段就代表预估的查询行数。对于第一条语句，预估的查询行数是104620.第二条语句，预估的查询行数是37116。明显第二条语句的查询行数少，那为什么没有选择索引a呢？

这是因为，如果使用索引a，每次从索引a上拿到一个值，都要回表查询。而如果选择扫描十万行的语句，则不需要回表。因此优化器评估这两条语句时，觉得回表查询更耗费时间，所以没有使用索引。但是实际中，这种方式并不是最优的。

3.解决办法

第一种解决办法是和第二条语句一样，采用force index强行选择一个索引。如果force index指定的索引在候选索引列表中，就直接选择这个索引，而不再去评估执行代价。但是这种方式不太优雅，而且改了索引名，语句也要改

第二种解决办法是考虑修改sql语句，引导MySQL使用我们期望的索引。

第三种解决办法是新建一个更合适的索引，删除掉误用的索引。

到此这篇关于浅谈MySQL为什么会选错索引的文章就介绍到这了,更多相关MySQL 选错索引内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家！

原文链接：https://blog.csdn.net/weixin_41799019/article/details/127429514

浅谈MySQL为什么会选错索引

1.引例

2.优化器的逻辑

3.解决办法

延伸 · 阅读

MySQL 8.0.19安装详细教程(windows 64位)

详解Mysql查询条件中字符串尾部有空格也能匹配上的问题

win10 下安装mysql服务器社区版本mysql 5.7.22 winx64的图文教程

MySQL 分表分库怎么进行数据切分

mysql中优化和修复数据库工具mysqlcheck详细介绍

Mysql 常用的时间日期及转换函数小结

基于mysql时间处理函数的应用详解

windows下修改Mysql5.7.11初始密码的图文教程

云服务器是什么，云主机干什么用的？

2020最新好用的web服务器软件推荐

服务器操作系统有哪些?

web服务器配置（图文详解）

企业如何选择阿里云服务器配置?

五大免费主机管理系统优缺点对比及推荐

2019最新三款Windows下连接Linux的ssh软件下载推荐

服务器常用管理软件盘点

Nginx服务器究竟是怎么执行PHP项目