一.概述
Redis是内存数据库,一旦服务器进程退出,服务器中的数据库内存数据状态也会消失。为了解决这个问题,Redis提供了RDB 持久化功能,这个功能可以将redis在内存中的数据库状态保存到磁盘中,避免数据意外丢失。
RDB持久化可以手动执行,也可以根据服务器配置选项定期执行,是在指定的时间间隔,对你的数据进行快照存储。该RDB文件快照是一个经过压缩的二进制文件。文件名为dump.rdb,该文件保存在redis目录下,当redis服务器停机后,只要RDB文件存在,下次重启Redis服务时就会自动还原数据库数据状态。
1.1 RDB文件的创建
通过Redis两个命令来生成RDB文件,一是SAVE,另一个是BGSAVE。SAVE命令是会阻塞Redis服务器进程,直到RDB文件创建完毕为止,在阻塞期间,服务器不能处理任何命令请求。
127.0.0.1:6379> save -- 等待RDB文件创建完毕 OK
与SAVE不同,BGSAVE命令会派生出一个子进程,然后由子进程负责创建RDB文件,服务器进程(父进程)继续处理命令请求。当BGSAVE命令在执行期间,客户端再发送BGSAVE命令会被服务器拒绝,因为同时执行两个GBSAVE命令也会产生竞争条件。最后BGREWRITEAOF和GBSAVE两个命令也不能同时执行。
127.0.0.1:6379> bgsave --派生子进程,并由子进程创建RDB文件 Background saving started
1.2 RDB文件载入
和创建文件不同,RDB文件的载入是在服务器启动时自动执行的,并没有用于载入RDB文件的命令,只要Redis服务器在启动时检测到RDB文件的存在,它就会自动载入RDB文件。能过启动时日志记录可以查看。需要注意的是,如果打开了AOF持久化,那么服务器会优先使用AOF文件来还原数据库状态。
1.3 自动间隔性保存
文件的创建除了SAVE和GBSAVE保存RDB 文件,还可以通过配置SAVE选项,让服务器每隔一段时间自动执行一次BGSAVE命令。可以配置SAVE选项设置多个保存条件,只要任意一个条件被满足,服务器就会执行BGSAVE命令。
--默认配置的SAVE选项,保存方式有三种条件,满足任意一种就可以,如下: 127.0.0.1:6379> config get save 1) "save" 2) "900 1 300 10 60 10000"
(1) 服务器在900秒之内,对数据库进行了至少1次修改。
(2) 服务器在300秒之内,对数据库进行了至少10次修改。
(3) 服务器在60秒之内,对数据库进行了至少10000次修改。
1.4 检查保存条件是否满足
Redis的服务器周期性操作默认每隔100毫秒就会检查执行一次,用于对正在运行的服务器进行维护,其中一项工作是检查save 选项所设置的保存条件是否已经满足,如果满足就调用BGSAVE命令。
1.5 RDB工作方式
当Redis需要保存dump.rdb文件时,服务器执行以下操作:
(1)Redis调用forks. 同时拥有父进程和子进程。
(2)子进程将数据集写入到一个临时 RDB 文件中。
(3)当子进程完成对新 RDB 文件的写入时,Redis用新 RDB 文件替换原来的 RDB 文件,并删除旧的 RDB 文件。
1.6 RDB 文件结构
下面简单了解一下RDB文件结构,这里不再深入了解。下面脚本显示了本机dump.rdb文件的位置。该rdb文件结构中各部分 如下图表格所示:
[root@xuegod64 redis]# pwd /usr/local/redis [root@xuegod64 redis]# ls -l -rwxrwxrwx 1 root root 1687 11月 22 10:03 dump.rdb
文件结构各部份 | 描述 |
redis | RDB文件最开头是REDIS部分,保存五个字符,程序在载入文件时,快速检查所载入的文件是否是RDB文件 |
Db_version | 一个字符串表示的整数,4个字节,记录了RDB文件的版本号 |
databases | 该部份包含着0个或任意多个数据库,以及各数据库中的键值对数据 |
Eof | 占1个字节,标志着RDB文件正文内容的结束,当程序遇到这个值的时候,就知道所有数据库的所有键值对都已经载入完毕了 |
Check_sum | 占8字节的无符号整数,保存一个校验和,通过前四部分内容进行计算得出。用来检查RDB文件是否出错或者损坏 |
下面通过linux的od命令来查看redis服务器产生的RDB 文件,并指定-c参数可以以ASCII编码方式打印信息。信息中能直接看到的信息是:第一部分是redis, Db_version部分是0008, Eof部分是372 。
1.7 RDB优势
(1) RDB是一个非常紧凑的文件,它保存了某个时间点得数据集,非常适用于数据集的备份,比如你可以在每个小时报保存一下过去24小时内的数据,同时每天保存过去30天的数据,这样即使出了问题你也可以根据需求恢复到不同版本的数据集。
(2)RDB是一个紧凑的单一文件,很方便传送到另一个远端数据中心,非常适用于灾难恢复。
(3)RDB在保存RDB文件时父进程唯一需要做的就是fork出一个子进程,接下来的工作全部由子进程来做,父进程不需要再做其他IO操作,所以RDB持久化方式可以最大化redis的性能。
(4)与AOF相比,在恢复大的数据集的时候,RDB方式会更快一些。
1.8 RDB缺点
(1)如果数据不允许任何丢失,那么RDB不适合(虽然可以配置不同的save时间点)。
(2)经常fork子进程来保存数据集到硬盘上,当数据集比较大的时候,fork的过程是非常耗时的,可能会导致Redis在一些毫秒级内不能响应客户端的请求。
二. RDB持久化测试
(1) 首先关闭redis服务。当关闭服务时报错,首先检查一下是否是权限的问题,因为在shutdown命令的时候,会进行save操作,而save需要操作dump.rdb文件,如果没有权限则会报这个错。
[root@xuegod64 redis]# redis-cli shutdown (error) ERR Errors trying to SHUTDOWN. Check logs -- 需要放开对dump.rdb文件的写入权限,服务关闭成功 [root@xuegod64 redis]# redis-cli shutdown [root@xuegod64 redis]# redis-cli
(2) 服务启动,首先set 写入一条数据,然后关闭服务进程。
[hsr@xuegod64 redis]$ redis-serverredis.conf 127.0.0.1:6379> set name "test" OK 127.0.0.1:6379> get name "test" 127.0.0.1:6379> exit [hsr@xuegod64 redis]$ redis-cli shutdown
(3)重次重启服务,查看持久化
查看刚才的键值对,发现键值对已存在,说明数据持久化保存到了磁盘中,原理是在关闭服务时,会先调用save操作,保存到dump.rdb文件中,在重启服务后,加载dump.rdb文件。
[hsr@xuegod64 redis]$ redis-serverredis.conf [hsr@xuegod64 redis]$ redis-cli 127.0.0.1:6379> get name "test"
总结:作为RDB快照持久化,如果是正常关闭redis服务,再重启后数据是不会丢失的,但如果系统崩溃或者强杀,用户将会丢失最近一次生成快照之后更改的所有数据。