来自面试官二面MySQL索引的连续灵魂拷问
本期主要面试考点
面试官考点之谈谈索引维护过程?页分裂?页合并?
面试官考点之简述一下查询时B+树索引搜索过程?
面试官考点之什么是回表?
面试官考点之什么是索引覆盖?使用场景?
面试官考点之什么情况下会索引失效?
面试官考点之哪些情况下,可能会面临索引失效的问题?
面试官考点之or走索引和索引失效分别是什么场景?
面试官考点之哪些情况下需要创建索引?
面试官考点之联合索引之最左前缀原则?
面试官考点之索引下推场景?
我是肥哥,一名不专业的面试官!
我是囧囧,一名积极找工作的小菜鸟!
囧囧表示:小白面试最怕的就是面试官问的知识点太笼统,自己无法快速定位到关键问题点!!!
面试官考点之谈谈索引维护过程?页分裂?页合并?
B+树为了维护索引有序性,在插入删除的时候需要做必要的维护,必要时候可能涉及到页分裂,页合并过程!
首先假设每个叶子节点(数据页或磁盘块)只能存储3条索引和数据记录,如图
情况1、新增行记录,ID=3,此时【数据页1】未满,只需要在data2后新增ID=3的行记录,B+树整体结构不需要进行调整
情况2、新增行记录,ID=8,此时【数据页2】已满,这时候需要申请一个新的数据页,然后挪动部分数据过去。这个过程称为页分裂。
页分裂过程消耗性能,同时空间利用率也降低了
有分裂就有合并,当相邻两个页由于删除了数据,利用率很低之后,会将数据页做合并。合并的过程,可以认为是分裂过程的逆过程。
当相邻两个页由于删除了数据,利用率很低之后,会将数据页做合并。合并的过程,可以认为是分裂过程的逆过程。
【数据页2】删除了ID=7,ID=8的行记录,此时【数据页2】【数据页3】利用率很低,将进行页合并。
面试官考点之简述一下查询时B+树索引搜索过程?
准备一张用户表,其中id为主键,age为普通索引
CREATE TABLE `user` (
`id` int(11) PRIMARY KEY,
`name` varchar(255) DEFAULT NULL,
`age` int(11) DEFAULT NULL
KEY `idx_age` (`age`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
select * from user where age=22 简述一下B+树索引搜索过程?
假设要查询的记录
id=5,name="张三",age=22
MySQL为每个索引分别维护了一棵B+Tree索引树,
主键索引非叶子节点维护了索引键,叶子节点存储行数据;
非主键索引也称为二级索引,非叶子节点存储主键;
B+树索引搜索过程
搜索条件 age=22,可走idx_age索引,首先加载idx_age索引树,找到age=22的记录,取得id=5
回表搜索,加载主键索引树,找到id=22的记录,取得整行数据
面试官考点之什么是回表?
idx_age二级索引树找到主键id后,回到id主键索引搜索的过程,就称为回表。
并非所有非主键索引搜索,都需要进行回表搜索,也就是下面要说的索引覆盖。
面试官考点之什么是索引覆盖?使用场景?
在上面提到的例子中,由于查询结果所需要的数据只在主键索引上有,所以不得不回表。
如果在查询的数据列里面,直接从索引列就能取到想要的结果,就不需要再回表去查,也称之为索引覆盖!
索引覆盖的优点
- 可以避免对Innodb主键索引的二次查询
- 可以避免MyISAM表进行系统调用
- 可以优化缓存,减少磁盘IO操作
修改一下上述栗子,满足索引覆盖条件?
select id, age from user where age=22
查询的信息,id,age都可以直接在idx_age 索引树中获取,不需要回表搜索。
由于覆盖索引可以减少树的搜索次数,显著提升查询性能,所以使用覆盖索引是一个常用
的性能优化手段。
索引是一把双刃剑,提供快速排序搜索的同时,索引字段的维护也是要付出相应的代价的。
因此,在建立冗余索引来支持覆盖索引时就需要权衡考虑了
面试官考点之索引失效?
创建的索引,到底有没有生效,或者说SQL语句有没有使用索引查询?
一个最常见的查询场景,建立idx_name索引
select * from t_user where user_name like '%mayun100%';
这条查询是否走索引?
select * from t_user where user_name like 'mayun100%';
这条查询是否走索引?
面试官考点之有哪些情况下,可能会面临索引失效的问题?
- like通配符,左侧开放情况下,全表扫描
- or条件筛选,可能会导致索引失效
- where中对索引列使用mysql的内置函数,一定失效
- where中对索引列进行运算(如,+、-、*、/),一定失效
- 类型不一致,隐式的类型转换,导致的索引失效
- where语句中索引列使用了负向查询,可能会导致索引失效 负向查询包括:NOT、!=、<>、!<、!>、NOT IN、NOT LIKE等。其中!< !> 为SQLServer语法。
- 索引字段可以为null,使用is null或is not null时,可能会导致索引失效
- 隐式字符编码转换导致的索引失效
- 联合索引中,where中索引列违背最左匹配原则,一定会导致索引失效
- MySQL优化器的最终选择,不走索引
面试官考点之or走索引和索引失效分别是什么场景?
or走索引和索引失效分别是什么场景?
OR 连接的是同一个字段,相同走索引
explain select * from t_user where user_name = 'mayun10' or user_name = 'mayun1000'
OR 连接的是两个不同的字段,不走索引
给address列增加索引
alter table t_user add index idx_address(address);
explain select * from t_user where user_name = 'mayun10' or address = '浙江杭州12';
OR 连接的是两个不同字段,如果两个字段皆有索引,走索引
(插播,下一期:《MySQL面试小抄》几种索引失效场景验证)
尽请关注:囧么肥事
面试小抄系列。
面试官考点之哪些情况下需要创建索引?
1.主键自动建立唯一索引
2.频繁查询的字段
3.JOIN 关联查询,作为外键关系的列建立索引
4.单键/组合索引的选择问题,高并发下倾向创建组合索引,创建时遵循最左前缀匹配原则
5.ORDER BY 查询中排序的字段,排序字段通过索引访问大幅提高排序速度
6.GROUP BY 需要分组字段或查询中统计字段
面试官考点之联合索引之最左前缀原则
MySQL建立多列索引(联合索引)有最左前缀的原则,即最左优先
当MySQL建立的是联合索引,假设以(a,b,c) 列作为联合索引,那么MySQL建树规则是什么?
我们知道MySQL会为每一个索引维护一颗B+Tree,非叶子节点存储索引key,叶子节点存储行数据data。
联合索引(a,b,c) 相当于建立了 (a), (a,b), (a,b,c) 三个索引,MySQL组装索引树时,是按照从左到右的顺序来建立B+Tree的联合索引树的。
匹配索引情况一
**假设(a,b,c)**索引要搜索的值为(‘张三’, 21, 100) ,检索数据时,匹配的顺序就是a,b,c。
B+Tree会优先比较a来确定下一步的所搜方向,如果a相同再依次比较b和c,最后得到检索的数据;
匹配索引情况二
**假设(a,c)**索引要搜索的值为(‘张三’, 100) ,检索数据时,匹配的顺序就是a,b,c。
B+Tree使用a来指定搜索方向,但下一个字段b缺失,所以只能把a等于张三的数据都找到,然后再匹配c是100的数据。
匹配索引情况三
**假设(b,c)**索引要搜索的值为(‘张三’, 21) ,检索数据时,无匹配顺序
B+Tree不知道下一步该查哪个节点,因为建立搜索树的时候a是第一个比较因子,必须要先根据a来搜索才能知道下一步去哪里查询。此时索引失效!
索引项是按照索引定义里面出现的字段顺序排序的,最左前缀可以是联合索引的最左N个字段,也可以是字符串索引的最左M个字符。
面试官考点之索引下推场景?
索引下推,即减少二级索引回表搜索次数!!!
通俗说,减少查询主键索引树次数,减少磁盘IO
建立联合索引 idx_age_weight
select * from user where age = 11 and weight = 98
5.6之前搜索过程是
在idx_age_weight 索引树中匹配出所有的 age = 11 索引,拿到主键id,回表去一条条再比对weight字段
如下图,需要进行3次回表搜索操作
5.6后的搜索过程是
在idx_age_weight 索引树中匹配出所有的 age = 11 索引,顺便对weight字段进行判断,过滤掉weight = 100的记录,然后再进行回表搜索。
如下图,只需要进行2次回表搜索操作`