手记

来自面试官二面MySQL索引的连续灵魂拷问

来自面试官二面MySQL索引的连续灵魂拷问

本期主要面试考点

面试官考点之谈谈索引维护过程?页分裂?页合并?
面试官考点之简述一下查询时B+树索引搜索过程?
面试官考点之什么是回表?
面试官考点之什么是索引覆盖?使用场景?
面试官考点之什么情况下会索引失效?
面试官考点之哪些情况下,可能会面临索引失效的问题?
面试官考点之or走索引和索引失效分别是什么场景?
面试官考点之哪些情况下需要创建索引?
面试官考点之联合索引之最左前缀原则?
面试官考点之索引下推场景?

我是肥哥,一名不专业的面试官!

我是囧囧,一名积极找工作的小菜鸟!

囧囧表示:小白面试最怕的就是面试官问的知识点太笼统,自己无法快速定位到关键问题点!!!



面试官考点之谈谈索引维护过程?页分裂?页合并?

B+树为了维护索引有序性,在插入删除的时候需要做必要的维护,必要时候可能涉及到页分裂,页合并过程!

首先假设每个叶子节点(数据页或磁盘块)只能存储3条索引和数据记录,如图

情况1、新增行记录,ID=3,此时【数据页1】未满,只需要在data2后新增ID=3的行记录,B+树整体结构不需要进行调整

情况2、新增行记录,ID=8,此时【数据页2】已满,这时候需要申请一个新的数据页,然后挪动部分数据过去。这个过程称为页分裂

页分裂过程消耗性能,同时空间利用率也降低了

有分裂就有合并,当相邻两个页由于删除了数据,利用率很低之后,会将数据页做合并。合并的过程,可以认为是分裂过程的逆过程

当相邻两个页由于删除了数据,利用率很低之后,会将数据页做合并。合并的过程,可以认为是分裂过程的逆过程。

【数据页2】删除了ID=7,ID=8的行记录,此时【数据页2】【数据页3】利用率很低,将进行页合并。

面试官考点之简述一下查询时B+树索引搜索过程?

准备一张用户表,其中id为主键,age为普通索引


CREATE TABLE `user` (

`id` int(11) PRIMARY KEY,

`name` varchar(255) DEFAULT NULL,

`age` int(11) DEFAULT NULL

KEY `idx_age` (`age`) USING BTREE

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

select * from user where age=22 简述一下B+树索引搜索过程?

假设要查询的记录


id=5,name="张三",age=22

MySQL为每个索引分别维护了一棵B+Tree索引树,

主键索引非叶子节点维护了索引键,叶子节点存储行数据;

非主键索引也称为二级索引,非叶子节点存储主键;

B+树索引搜索过程

搜索条件 age=22,可走idx_age索引,首先加载idx_age索引树,找到age=22的记录,取得id=5

回表搜索,加载主键索引树,找到id=22的记录,取得整行数据

面试官考点之什么是回表?

idx_age二级索引树找到主键id后,回到id主键索引搜索的过程,就称为回表。

并非所有非主键索引搜索,都需要进行回表搜索,也就是下面要说的索引覆盖。

面试官考点之什么是索引覆盖?使用场景?

在上面提到的例子中,由于查询结果所需要的数据只在主键索引上有,所以不得不回表。

如果在查询的数据列里面,直接从索引列就能取到想要的结果,就不需要再回表去查,也称之为索引覆盖!

索引覆盖的优点

  1. 可以避免对Innodb主键索引的二次查询
  1. 可以避免MyISAM表进行系统调用
  1. 可以优化缓存,减少磁盘IO操作

修改一下上述栗子,满足索引覆盖条件?


select id, age from user where age=22

查询的信息,id,age都可以直接在idx_age 索引树中获取,不需要回表搜索。

由于覆盖索引可以减少树的搜索次数,显著提升查询性能,所以使用覆盖索引是一个常用

的性能优化手段。

索引是一把双刃剑,提供快速排序搜索的同时,索引字段的维护也是要付出相应的代价的。

因此,在建立冗余索引来支持覆盖索引时就需要权衡考虑了

面试官考点之索引失效?

创建的索引,到底有没有生效,或者说SQL语句有没有使用索引查询?

一个最常见的查询场景,建立idx_name索引


select * from t_user where user_name like '%mayun100%';

这条查询是否走索引?


select * from t_user where user_name like 'mayun100%';

这条查询是否走索引?

面试官考点之有哪些情况下,可能会面临索引失效的问题?

  1. like通配符,左侧开放情况下,全表扫描
  1. or条件筛选,可能会导致索引失效
  1. where中对索引列使用mysql的内置函数,一定失效
  1. where中对索引列进行运算(如,+、-、*、/),一定失效
  1. 类型不一致,隐式的类型转换,导致的索引失效
  1. where语句中索引列使用了负向查询,可能会导致索引失效 负向查询包括:NOT、!=、<>、!<、!>、NOT IN、NOT LIKE等。其中!< !> 为SQLServer语法。
  1. 索引字段可以为null,使用is null或is not null时,可能会导致索引失效
  1. 隐式字符编码转换导致的索引失效
  1. 联合索引中,where中索引列违背最左匹配原则,一定会导致索引失效
  1. MySQL优化器的最终选择,不走索引

面试官考点之or走索引和索引失效分别是什么场景?

or走索引和索引失效分别是什么场景?

OR 连接的是同一个字段,相同走索引


explain select * from t_user where user_name = 'mayun10' or user_name = 'mayun1000'

OR 连接的是两个不同的字段,不走索引

给address列增加索引


alter table t_user add index idx_address(address);

explain select * from t_user where user_name = 'mayun10' or address = '浙江杭州12';

OR 连接的是两个不同字段,如果两个字段皆有索引,走索引

(插播,下一期:《MySQL面试小抄》几种索引失效场景验证)

尽请关注:囧么肥事

面试小抄系列。

面试官考点之哪些情况下需要创建索引?

1.主键自动建立唯一索引

2.频繁查询的字段

3.JOIN 关联查询,作为外键关系的列建立索引

4.单键/组合索引的选择问题,高并发下倾向创建组合索引,创建时遵循最左前缀匹配原则

5.ORDER BY 查询中排序的字段,排序字段通过索引访问大幅提高排序速度

6.GROUP BY 需要分组字段或查询中统计字段

面试官考点之联合索引之最左前缀原则

MySQL建立多列索引(联合索引)有最左前缀的原则,即最左优先

当MySQL建立的是联合索引,假设以(a,b,c) 列作为联合索引,那么MySQL建树规则是什么?

我们知道MySQL会为每一个索引维护一颗B+Tree,非叶子节点存储索引key,叶子节点存储行数据data。

联合索引(a,b,c) 相当于建立了 (a), (a,b), (a,b,c) 三个索引,MySQL组装索引树时,是按照从左到右的顺序来建立B+Tree的联合索引树的。

匹配索引情况一

**假设(a,b,c)**索引要搜索的值为(‘张三’, 21, 100) ,检索数据时,匹配的顺序就是a,b,c。

B+Tree会优先比较a来确定下一步的所搜方向,如果a相同再依次比较b和c,最后得到检索的数据;

匹配索引情况二

**假设(a,c)**索引要搜索的值为(‘张三’, 100) ,检索数据时,匹配的顺序就是a,b,c。

B+Tree使用a来指定搜索方向,但下一个字段b缺失,所以只能把a等于张三的数据都找到,然后再匹配c是100的数据。

匹配索引情况三

**假设(b,c)**索引要搜索的值为(‘张三’, 21) ,检索数据时,无匹配顺序

B+Tree不知道下一步该查哪个节点,因为建立搜索树的时候a是第一个比较因子,必须要先根据a来搜索才能知道下一步去哪里查询。此时索引失效!

索引项是按照索引定义里面出现的字段顺序排序的,最左前缀可以是联合索引的最左N个字段,也可以是字符串索引的最左M个字符。

面试官考点之索引下推场景?

索引下推,即减少二级索引回表搜索次数!!!

通俗说,减少查询主键索引树次数,减少磁盘IO

建立联合索引 idx_age_weight


select * from user where age = 11 and weight = 98

5.6之前搜索过程是

在idx_age_weight 索引树中匹配出所有的 age = 11 索引,拿到主键id,回表去一条条再比对weight字段

如下图,需要进行3次回表搜索操作

5.6后的搜索过程是

在idx_age_weight 索引树中匹配出所有的 age = 11 索引,顺便对weight字段进行判断,过滤掉weight = 100的记录,然后再进行回表搜索。

如下图,只需要进行2次回表搜索操作`


0人推荐
随时随地看视频
慕课网APP