进入正题之前,首先来看下分布式数据库出现的场景都有哪些:
- 单表数据量爆炸,千万级、亿级等,各种数据操作效率很低 。 关系型数据库在大于一定数据量的情况下检索性能会急剧下降。在面对互联网海量数据情况时,所有数据都存于一张表,显然会轻易超过数据库表可承受的数据量阀值。这个单表可承受的数据量阀值,需根据数据库和并发量的差异,通过实际测试获得;
- 单机数据库的瓶颈问题,处理不了高强度io。现代企业程序的瓶颈问题是数据库的瓶颈问题,所以数据库只做存储用,不再使用触发器,事物;
- 不同业务对应不同业务数据库,即使某个数据库挂了,不影响其他数据库对应的服务使用,服务高可用;
- 为了方便扩展,动态增加数据库节点,保证扩展性好;
- 数据备份,数据最重要的嘛。
环境要求
- PHP7.1+,使用ThinkPHP6.0框架的话,运行环境要求PHP7.1+;
- 至少两个服务,当然不是真的买两台服务器,推荐使用vagrant+virtualBox搭建本地虚拟服务
项目中数据库配置文件修改,支持读写分离
数据访问层支持分布式数据库,包括读写分离,要启用分布式数据库,需要开启数据库配置文件中的deploy参数。在config文件夹下找到database.php文件
// 数据库连接配置信息
'connections' => [
'mysql' => [
// 数据库类型
'type' => Env::get('database.type', 'mysql'),
// 服务器地址
'hostname' => ['192.168.33.10', '188.180.0.228'],
// 数据库名
'database' => "tp",
// 用户名
'username' => "root",
// 密码
'password' => '123456',
// 端口
'hostport' => Env::get('database.hostport', '3306'),
// 数据库连接参数
'params' => [],
// 数据库编码默认采用utf8
'charset' => Env::get('database.charset', 'utf8'),
// 数据库表前缀
'prefix' => Env::get('database.prefix', ''),
// 数据库部署方式:0 集中式(单一服务器),1 分布式(主从服务器)
'deploy' => 1,
// 数据库读写是否分离 主从式有效
'rw_separate' => true,
// 开启自动主库读取
'read_master' => false,
// 读写分离后 主服务器数量
'master_num' => 1,
// 指定从服务器序号
'slave_no' => '',
// 是否严格检查字段是否存在
'fields_strict' => true,
// 是否需要断线重连
'break_reconnect' => false,
// 监听SQL
'trigger_sql' => true,
// 开启字段缓存
'fields_cache' => false,
// 字段缓存路径
'schema_cache_path' => app()->getRuntimePath() . 'schema' . DIRECTORY_SEPARATOR,
],
],
配置修改需要注意以下几点
- 启用分布式数据库后,hostname参数是关键,hostname的个数决定了分布式数据库的数量,默认情况下第一个地址就是主服务器。
- 如果主从服务器的下列连接参数一致,只需要设置一个即可,对于不同的参数,可以分别设置。切记要么相同,要么每个都设置。
连接参数 |
---|
username |
password |
hostport |
database |
dsn |
charset |
- 读写分离
- 默认的情况下读写不分离,也就是每台服务器都可以进行读写操作,对于主从式数据库而言,需要设置读写分离,修改这个参数就好了。
'rw_separate' => true,
在读写分离的情况下,默认第一个数据库配置是主服务器的配置信息,负责写入数据,如果设置了master_num参数,则可以支持多个主服务器写入(每次随机连接其中一个主服务器)。其它的地址都是从数据库,负责读取数据,数量不限制。每次连接从服务器并且进行读取操作的时候,系统会随机进行在从服务器中选择。同一个数据库连接的每次请求只会连接一次主服务器和从服务器,如果某次请求的从服务器连接不上,会自动切换到主服务器进行查询操作。
如果不希望随机读取,或者某种情况下其它从服务器暂时不可用,还可以设置slave_no 指定固定服务器进行读操作,slave_no指定的序号表示hostname中数据库地址的序号,从0开始。
更详细的配置可参考官方文档。
主从同步
主从数据库的数据同步工作不在框架实现,需要数据库考虑自身的同步或者复制机制。
半自动复制插件脚本安装
- 登录MySQL执行脚本:
- 主库:
install plugin rpl_semi_sync_master soname 'semisync_master.so';
- 从库:
INSTALL PLUGIN rpl_semi_sync_slave SONAME 'semisync_slave.so';
主从数据库的my.cnf文件配置:
主库:
rpl_semi_sync_master_enabled=1
rpl_semi_sync_master_timeout=1000 #此单位是毫秒
log-bin=mysql-bin #打开日志(主机需要打开)
server-id=1 #服务器id
log-bin-index=mysql-bin.index
sync_binlog=1
#给从机同步的库,可以多个
binlog-do-db=tp #从库的数据库名称
binlog-ignore-db=mysql
binlog-ignore-db=performance_schema
binlog-ignore-db=information_schema
expire_logs_days=1
从库:
rpl_semi_sync_slave_enabled=1
server-id=2 #服务器id
#要从主机同步的库
replicate-do-db=tp #主库的数据库名
修改好之后,重新启动主从数据库的服务
主库授权同步从库的账户
GRANT REPLICATION SLAVE ON *.* TO 'root'@'188.180.0.228' IDENTIFIED BY 'XXXXXX'; #主数据库授权同步账户
FLUSH PRIVILEGES; #刷新权限
SHOW MASTER STATUS; #查看主服务状态
配置从库连接主库服务器的参数
CHANGE MASTER TO MASTER_HOST='192.168.33.10',MASTER_USER='root', MASTER_PASSWORD='XXXXXX',MASTER_LOG_FILE='mysql-bin.000008',MASTER_LOG_POS=1528;
start slave; #开启SLAVE同步
show slave status \G; #查看下slave状态
注意:MASTER_LOG_FILE=’mysql-bin.000008’,MASTER_LOG_POS=1528是通过前面的主数据库SHOW MASTER STATUS;得到
当Slave_IO_Running和Slave_SQL_Running都为Yes,说明主从复制配置成功,如果有必要停止或者撤销同步账号的权限,还可操作。
stop slave; #停止SLAVE同步
GRANT REPLICATION SLAVE ON *.* TO 'root'@'188.180.0.228' IDENTIFIED BY 'XXXXXX';# 撤销已经赋予给MySQL同步账户的权限
实际操作
1.先插入5条数据
public function add()
{
$data = [];
for ($i = 0; $i < 5; $i++) {
array_push($data, ['name' => 'name_' . ($i+1)]);
}
$res = Db::table('user')->insertAll($data);
echo '插入成功条数:' . $res;
}
浏览器访问:
如上图所示,插入数据连接的是主数据库。
主从数据库插入数据如下:
- 执行查询和更新操作
public function list()
{
$res = Db::table('user')->where('id','=',1)->find();
$row = Db::table('user')->where('id','=',$res['id'])->update(['name' => 'name_9527']);
echo $row;
}
如上图所示:查询连接的是从库,而更新操作连接的主库。
数据同步结果:
以上就是数据库读写分离、主从同步的框架内文件配置、数据库服务器文件配置和代码示例。