redis 系列16 持久化 RDB@慕课网原创_慕课网

一.概述

　　Redis是内存数据库，一旦服务器进程退出，服务器中的数据库内存数据状态也会消失。为了解决这个问题，Redis提供了RDB 持久化功能，这个功能可以将redis在内存中的数据库状态保存到磁盘中，避免数据意外丢失。

　　RDB持久化可以手动执行，也可以根据服务器配置选项定期执行，是在指定的时间间隔,对你的数据进行快照存储。该RDB文件快照是一个经过压缩的二进制文件。文件名为dump.rdb，该文件保存在redis目录下，当redis服务器停机后，只要RDB文件存在，下次重启Redis服务时就会自动还原数据库数据状态。

　　1.1 RDB文件的创建

　　　　通过Redis两个命令来生成RDB文件，一是SAVE，另一个是BGSAVE。SAVE命令是会阻塞Redis服务器进程，直到RDB文件创建完毕为止，在阻塞期间，服务器不能处理任何命令请求。

    127.0.0.1:6379> save   -- 等待RDB文件创建完毕
    OK

　　　　与SAVE不同，BGSAVE命令会派生出一个子进程，然后由子进程负责创建RDB文件，服务器进程(父进程)继续处理命令请求。当BGSAVE命令在执行期间，客户端再发送BGSAVE命令会被服务器拒绝，因为同时执行两个GBSAVE命令也会产生竞争条件。最后BGREWRITEAOF和GBSAVE两个命令也不能同时执行。

    127.0.0.1:6379> bgsave  --派生子进程，并由子进程创建RDB文件
    Background saving started

　　1.2 RDB文件载入

　　　　和创建文件不同，RDB文件的载入是在服务器启动时自动执行的，并没有用于载入RDB文件的命令，只要Redis服务器在启动时检测到RDB文件的存在，它就会自动载入RDB文件。能过启动时日志记录可以查看。需要注意的是，如果打开了AOF持久化，那么服务器会优先使用AOF文件来还原数据库状态。

　　1.3 自动间隔性保存

　　　　文件的创建除了SAVE和GBSAVE保存RDB 文件，还可以通过配置SAVE选项，让服务器每隔一段时间自动执行一次BGSAVE命令。可以配置SAVE选项设置多个保存条件，只要任意一个条件被满足，服务器就会执行BGSAVE命令。

    --默认配置的SAVE选项，保存方式有三种条件，满足任意一种就可以，如下：    127.0.0.1:6379> config get save    1) "save"
    2) "900 1 300 10 60 10000"

　　　　(1) 服务器在900秒之内，对数据库进行了至少1次修改。

　　　　(2) 服务器在300秒之内，对数据库进行了至少10次修改。

　　　　(3) 服务器在60秒之内，对数据库进行了至少10000次修改。

　　1.4 检查保存条件是否满足

　　　　Redis的服务器周期性操作默认每隔100毫秒就会检查执行一次，用于对正在运行的服务器进行维护，其中一项工作是检查save 选项所设置的保存条件是否已经满足，如果满足就调用BGSAVE命令。

　　1.5 RDB工作方式

　　　　当Redis需要保存dump.rdb文件时，服务器执行以下操作：

　　　　(1)Redis调用forks. 同时拥有父进程和子进程。

　　　　(2)子进程将数据集写入到一个临时 RDB 文件中。

　　　　(3)当子进程完成对新 RDB 文件的写入时，Redis用新 RDB 文件替换原来的 RDB 文件，并删除旧的 RDB 文件。

　　1.6 RDB 文件结构

　　　　下面简单了解一下RDB文件结构，这里不再深入了解。下面脚本显示了本机dump.rdb文件的位置。该rdb文件结构中各部分如下图表格所示：

    [root@xuegod64 redis]# pwd    /usr/local/redis
    [root@xuegod64 redis]# ls -l    -rwxrwxrwx 1 root root    1687 11月 22 10:03 dump.rdb

文件结构各部份	描述
redis	RDB文件最开头是REDIS部分，保存五个字符，程序在载入文件时，快速检查所载入的文件是否是RDB文件
Db_version	一个字符串表示的整数，4个字节，记录了RDB文件的版本号
databases	该部份包含着0个或任意多个数据库，以及各数据库中的键值对数据
Eof	占1个字节，标志着RDB文件正文内容的结束，当程序遇到这个值的时候，就知道所有数据库的所有键值对都已经载入完毕了
Check_sum	占8字节的无符号整数，保存一个校验和，通过前四部分内容进行计算得出。用来检查RDB文件是否出错或者损坏

　　　　下面通过linux的od命令来查看redis服务器产生的RDB 文件，并指定-c参数可以以ASCII编码方式打印信息。信息中能直接看到的信息是：第一部分是redis, Db_version部分是0008, Eof部分是372 。

　　1.7 RDB优势

　　　　(1) RDB是一个非常紧凑的文件,它保存了某个时间点得数据集,非常适用于数据集的备份,比如你可以在每个小时报保存一下过去24小时内的数据,同时每天保存过去30天的数据,这样即使出了问题你也可以根据需求恢复到不同版本的数据集。

　　　　(2)RDB是一个紧凑的单一文件,很方便传送到另一个远端数据中心，非常适用于灾难恢复。

　　　　(3)RDB在保存RDB文件时父进程唯一需要做的就是fork出一个子进程,接下来的工作全部由子进程来做，父进程不需要再做其他IO操作，所以RDB持久化方式可以最大化redis的性能。

　　　　(4)与AOF相比,在恢复大的数据集的时候，RDB方式会更快一些。

　　1.8 RDB缺点

　　　　(1)如果数据不允许任何丢失，那么RDB不适合（虽然可以配置不同的save时间点）。

　　　　(2)经常fork子进程来保存数据集到硬盘上,当数据集比较大的时候,fork的过程是非常耗时的,可能会导致Redis在一些毫秒级内不能响应客户端的请求。

二. RDB持久化测试

　　　　(1) 首先关闭redis服务。当关闭服务时报错，首先检查一下是否是权限的问题，因为在shutdown命令的时候，会进行save操作，而save需要操作dump.rdb文件，如果没有权限则会报这个错。

    [root@xuegod64 redis]# redis-cli shutdown
    (error) ERR Errors trying to SHUTDOWN. Check logs    -- 需要放开对dump.rdb文件的写入权限，服务关闭成功
    [root@xuegod64 redis]# redis-cli shutdown
    [root@xuegod64 redis]# redis-cli

　　　　(2) 服务启动，首先set 写入一条数据,然后关闭服务进程。

    [hsr@xuegod64 redis]$ redis-serverredis.conf    127.0.0.1:6379> set name "test"
    OK    127.0.0.1:6379> get name    "test"
    127.0.0.1:6379> exit
    [hsr@xuegod64 redis]$ redis-cli shutdown

　　　　(3)重次重启服务,查看持久化

　　　　查看刚才的键值对，发现键值对已存在，说明数据持久化保存到了磁盘中，原理是在关闭服务时，会先调用save操作，保存到dump.rdb文件中,在重启服务后，加载dump.rdb文件。

    [hsr@xuegod64 redis]$ redis-serverredis.conf
    [hsr@xuegod64 redis]$ redis-cli    127.0.0.1:6379> get name    "test"

　　总结：作为RDB快照持久化，如果是正常关闭redis服务，再重启后数据是不会丢失的，但如果系统崩溃或者强杀，用户将会丢失最近一次生成快照之后更改的所有数据。

原文出处：https://www.cnblogs.com/MrHSR/p/9999957.html