手记

如何利用mysql5.7提供的虚拟列来提高查询效率

前言

在我们日常开发过程中,有时候因为对索引列进行函数调用,导致索引失效。举个例子,比如我们要按月查询记录,而当我们 表中只存时间,如果我们使用如下语句,其中create_time为索引列

select count(*) from user where MONTH(create_time) = 5

虽然可能查到正确的结果,但通过explain我们会发现没走索引。因此我们为了能确保使用索引,我们可能会改成

select count(*) from user where create_time BETWEEN '2022-05-01' AND '2022-06-01';

或者干脆在数据库表中冗余一个月份的列字段,并对这个月份创建索引。如果我们使用的mysql是5.7版本,我们则可以使用mysql5.7版本提供的一个新特性–虚拟列来达到上述效果

虚拟列

在mysql5.7支持2种虚拟列virtual columns 和 stored columns 。两者的区别是virtual 只是在读行的时候计算结果,但在物理上是不存储,因此不占存储空间,且仅在InnoDB引擎上建二级索引,而stored 则是当行数据进行插入或更新时计算并存储的,是需要占用物理空间的,支持在MyISAM和InnoDB引擎创建索引

mysql5.7 默认的虚拟列类型为virtual columns

1、创建虚拟列语法

ALTER TABLE 表名称 add column 虚拟列名称 虚拟列类型 [GENERATED ALWAYS] as (表达式) [VIRTUAL | STORED];

2、使用虚拟列注意事项

a、衍生列的定义可以修改,但virtual和stored之间不能相互转换,必要时需要删除重建

b、虚拟列字段只读,不支持 INSRET 和 UPDATE

c、只能引用本表的非 generated column 字段,不可以引用其它表的字段

d、使用的表达式和操作符必须是 Immutable 属性,比如不能使用 CONNECTION_ID(), CURRENT_USER(), NOW()

e、可以将已存在的普通列转化为stored类型的衍生列,但virtual类型不行;同样的,可以将stored类型的衍生列转化为普通列,但virtual类型的不行

f、虚拟列定义不允许使用自增 (AUTO_INCREMENT),也不允许使用自增基列

g、虚拟列允许修改表达式,但不允许修改存储方式(只能通过删除重新创建来修改)

h、如果虚拟列用作索引,会有一个缺点值会存储两次。一次用作虚拟列的值,一次用作索引中的值

3、虚拟列的使用场景

a、虚拟列可以简化和统一查询,将复杂条件定义为生成的列,可以在查询时直接使用虚拟列(代替视图)

b、存储虚拟列可以用作实例化缓存,以用于动态计算成本高昂的复杂条件

c、虚拟列可以模拟功能索引,并且可以使用索引,这对与无法直接使用索引的列(JSON 列)非常有用。

示例

因为mysql5.7也支持json列,因此本示例就以json和虚拟列为例子演示一下示例

1、创建示例表

CREATE TABLE `t_user_json` (
  `id` int NOT NULL AUTO_INCREMENT,
  `user_info` json DEFAULT NULL,
  `create_time` datetime DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

2、创建虚拟列

注: 虚拟列可以在建表语句时候,直接创建即可。本示例是为了突出虚拟列语法

ALTER TABLE t_user_json ADD COLUMN v_user_name VARCHAR(50) GENERATED ALWAYS AS (JSON_UNQUOTE(json_extract(user_info,'$.username')));

正常我们的json语句如下

{"age": 23, "email": "likairui@qq.com", "mobile": "89136682644", "fullname": "李凯瑞", "username": "likairui"}

我们通过JSON_UNQUOTE来去除双引号,否则到时候生成的虚拟列v_user_name 的值会变成"likairui",而实际我们需要的字段值应该likairui

因为mysql5.7的json不是本文的重点,本文就不论述了,如果对mysql5.7 json语法函数感兴趣的朋友可以查看如下链接

3、为虚拟列创建索引

ALTER TABLE t_user_json ADD INDEX idx_v_user_name(v_user_name);

4、查看生成的表数据

5、查看是否使用了索引

EXPLAIN  SELECT  id,user_info,create_time,v_user_name AS username,v_date_month AS MONTH  FROM t_user_json     WHERE (v_user_name = 'likairui')


注: 在mysql8.0版本可以使用EXPLAIN ANALYZE,他可以查看sql的耗时情况

EXPLAIN ANALYZE SELECT  id,user_info,create_time,v_user_name AS username,v_date_month AS MONTH  FROM t_user_json     WHERE (v_user_name = 'cengwen')

6、代码层面的小细节

因为虚拟列是不能进行插入和更新的,因此使用orm框架的时候,要特别注意这点。比如使用mybatis-plus时,要记得在实体的虚拟列的映射字段上加上如下注解

 @TableField(value = "v_user_name",insertStrategy = FieldStrategy.NEVER,updateStrategy = FieldStrategy.NEVER)
    private String username;

加上这个注解后,虚拟列字段就不会进行更新或者插入

总结

本文基于mysql5.7大体介绍了一下虚拟列,如果是使用mysql8.0.13以上的版本,可以函数索引,他的实现方式本质也是基于虚拟列实现。所谓的函数索引就是在创建索引的时候,支持使用函数表达式。比如

ALTER TABLE user ADD INDEX((MONTH(create_time)));

通过函数索引也可以很方便提高我们的查询效率。具体使用可以查看如下链接

demo链接

0人推荐
随时随地看视频
慕课网APP