手记

聊聊数据库~SQL环境篇

传统数据库

本来准备直接开讲NoSQL的(当时开篇就是说的NoSQL)考虑到有些同志可能连MySQL系都没接触过,所以我们2019说数据系的时候预计从MySQL(穿插MSSQL)开始,这篇文章就当试水篇,效果好就继续往下写~(这篇偏理论和运维)

1.1.MariaDB and MySQL

官方文档:https://mariadb.com/kb/zh-cn/mariadb

目前主流:MySQL 5.7 or MariaDB 5.5.x(推荐)

多一句嘴,MySQL当年被Oracle收购后,MySQL之父觉得靠Oracle维护MySQL很不靠谱,然后就跳槽弄了个MariaDB(很多Oracle竞争对手扶持着),目前MariaDB是发展最快的MySQL分支版本(PS:MySQL现在是双协议了,大部分公司用的版本都是<=5.7

然后得说下迁移问题:MySQL 5.xMariaDB 5.x基本上是无缝的,MariaDB最新稳定版为:MariaDB 5.5

MariaDBMySQL兼容性可以查看:
https://mariadb.com/kb/en/library/mariadb-vs-mysql-compatibility

PS:国内比较火的还有阿里的MySQL分支https://github.com/alibaba/AliSQL

不谈其他的,咱们看看它们开发的积极程度就知道为什么MariaDB是主流了

1.2.MariaDB部署

1.环境配置和初始化

安装很简单,以CentOS为例:

systemctl start mariadb.service   # 启动MariaDB
systemctl enable mariadb.service  # 设置开机启动

systemctl stop mariadb.service    # 停止MariaDB
systemctl restart mariadb.service # 重启MariaDB

PS:Win安装注意这一步:

执行文件简单说明:有时候我们 ps aux | grep mysql 的时候,发现运行的并不是/usr/bin/下的mysqld而是mysqld_safe,那这个mysqld_safe是啥呢?==> 线程安全的实例

MariaDB的程序组成:ls /usr/bin | grep mysql

  1. Client:

  • mysql 命令行客户端

  • mysqldump 数据库备份用

  • mysqladmin 远程管理工具

  • mysqlbinlog 二进制日志管理工具

  • ...

Server:

  • mysqld_safe 线程安全的实例

  • mysqld_multi 多实例

  • mysqld

  • mysql_secure_installation 安全初始化工具(记得先启动数据库哦)

  • ...

mysql的账号由两部分组成:username@host,MySQL客户端连接参数:

  • -u用户名:默认为root

  • -h服务器主机:默认为localhost

    • %匹配任意长度的任意字符:172.16.0.0/16 ==> 172.16.%.%

    • _匹配任意单个字符

    • host用于限制用户可以通过哪些主机连接

    • 支持通配符:

  • -p密码:默认为

    • 安装完成后运行mysql_secure_installation来设置密码并初始化

很多人安装完成后是这样设置密码的:(不推荐)

正确打开方式:mysql_secure_installation

如果允许root远程登录:Disallow root login remotely? [Y/n] n

安全初始化后登录图示:

2.配置文件

MariaDB 5.5.60为例:

  1. Linux:配置文件查找顺序(找不到就往下继续)

  • /etc/my.cnf --> /etc/mysql/conf.d/*.cnf --> ~/.my.cnf

Windows:MariaDB安装目录/data/my.ini

PS:一般配置文件都会设置这3个

# 指定数据库文件存放路径datadir = /home/dnt/data# 独立表空间: 每一个表都有一个.frm表描述文件,还有一个.ibd文件innodb_file_per_table=on# 不对连接进行DNS解析(省时)skip_name_resolve=on

其他配置MariaDB提供了样本:

[dnt@localhost ~] ls /usr/share/mysql/ | grep .cnf
my-huge.cnf            # 超大内存配置参考
my-innodb-heavy-4G.cnf # 4G内存配置参考
my-large.cnf           # 大内存配置
my-medium.cnf          # 中等内存配置
my-small.cnf           # 小内存配置

PS:thread_concurrency=CPU数*2最佳,修改配置后记得重启数据库

3.远程访问

1.之前安全初始化的时候把root禁止远程登录了,现在我们创建一个其他用户

2.给用户权限

3.防火墙放行指定端口

4.远程客户端测试一下

Code如下:

# root账户登录mysql -uroot -p# 新增用户insert into mysql.user(user,host,password) values("用户名","%",password("密码"));# 刷新设置flush privileges;# 分配权限grant all privileges on 数据库.* to 用户名@"%" identified by "密码";# 刷新设置flush privileges;# 显示服务状态systemctl status firewalld# 添加 --permanent永久生效(没有此参数重启后失效)firewall-cmd --zone=public --add-port=80/tcp --permanent# 重新载入firewall-cmd --reload# 查看firewall-cmd --zone= public --query-port=80/tcp# 删除firewall-cmd --zone= public --remove-port=80/tcp --permanent

SQLServer远程连接https://www.cnblogs.com/dunitian/p/5474501.html

MySQL军规(58)

文章结尾贴一节58MySQL军规:(适用于并发量大,数据量大的典型互联网业务

1.基础规范

  1. 表存储引擎必须使用InnoDB

  2. 表字符集默认使用utf8,必要时候使用utf8mb4

  • utf8通用,无乱码风险,汉字3字节,英文1字节

  • utf8mb4utf8的超集,存储4字节时使用(eg:表情符号)

禁止使用存储过程,视图,触发器,Event

  • 调试,排错,迁移都比较困难,扩展性较差

  • 对数据库性能影响较大,互联网业务,能让站点层和服务层干的事情,不要交到数据库层

禁止在数据库中存储大文件(eg:照片)

  • 可以将大文件存储在对象存储系统,数据库中存储路径

禁止在线上环境做数据库压力测试

  • 测试,开发,线上数据库环境必须隔离

2.命名规范

  1. 库名,表名,列名必须用小写,采用下划线分隔

  • abc,Abc,ABC都是给自己埋坑

库名,表名,列名必须见名知义,长度不要超过32字符

  • tmp,wushan谁TM知道这些库是干嘛的

库备份必须以bak为前缀,以日期为后缀

  • 从库必须以-s为后缀

  • 备库必须以-ss为后缀

3.表设计规范

  1. 单实例表个数必须控制在2000个以内

  2. 单表分表个数必须控制在1024个以内

  3. 表必须有主键,推荐使用unsigned整数为主键

  • 潜在坑:删除无主键的表,如果是row模式的主从架构,从库会挂住

禁止使用外键,如果要保证完整性,应由应用程式实现

  • 外键使得表之间相互耦合,影响update/delete等SQL性能

  • 有可能造成死锁,高并发情况下容易成为数据库瓶颈

建议将大字段,访问频度低的字段拆分到单独的表中存储,分离冷热数据

  • 垂直拆分的依据,尽量把长度较短,访问频率较高的属性放在主表里

  • 流量大数据量大时,数据访问要有service层,并且service层不要通过join来获取主表和扩展表的属性

  • 具体可以参考沈剑大牛写的《如何实施数据库垂直拆分》

4.列设计规范

  1. 根据业务区分使用tinyint/int/bigint,分别会占用1/4/8字节

  2. 根据业务区分使用char/varchar(PS:没有MSSQL里的nvarchar

  • 字段长度固定,或者长度近似的业务场景,适合使用char能够减少碎片,查询性能高

  • 字段长度相差较大,或者更新较少的业务场景,适合使用varchar,能够减少空间

根据业务区分使用datetime/timestamp

  • datetime占用5个字节,timestamp占用4个字节

  • 存储年使用year,存储日期使用date,存储时间使用datetime

必须把字段定义为NOT NULL并设默认值

  • NULL需要更多的存储空间

  • NULL的列使用索引,索引统计,值都更加复杂,MySQL更难优化

  • NULL只能采用IS NULL或者IS NOT NULL,而在=/!=/in/not in时有大坑

使用int unsigned存储IPv4,不要用char(15)

使用varchar(20)存储手机号,不要使用整数

  • 手机号不会用来做数学运算

  • varchar可以模糊查询(eg:like ‘138%’)

  • 牵扯到国家代号,可能出现+、-、()等字符,eg:+86

使用tinyint来代替enum

  • enum增加新值要进行DDL操作

5.索引规范(常用)

  1. 唯一索引使用uniq_字段名来命名

  2. 非唯一索引使用idx_字段名来命名

  3. 单张表索引数量建议控制在5个以内

  • 互联网高并发业务,太多索引会影响写性能

  • 异常复杂的查询需求,可以选择ES等更为适合的方式存储

  • 生成执行计划时,如果索引太多,会降低性能,并可能导致MySQL选择不到最优索引

组合索引字段数不建议超过5个

  • 如果5个字段还不能极大缩小row范围,八成是设计有问题

不建议在频繁更新的字段上建立索引

非必要不要进行join查询,如果要进行join查询,被join的字段必须类型相同,并建立索引

  • join字段类型不一致容易导致全表扫描

理解组合索引最左前缀原则,避免重复建设索引

  • 如果建立了(a,b,c),相当于建立了(a), (a,b), (a,b,c)

6.SQL规范(常用)

  1. 禁止使用select *,只获取必要字段

  • 指定字段能有效利用索引覆盖

  • select *会增加cpu/io/内存/带宽的消耗

  • 指定字段查询,在表结构变更时,能保证对应用程序无影响

insert必须指定字段,禁止使用insert into T values()

  • 指定字段插入,在表结构变更时,能保证对应用程序无影响

隐式类型转换会使索引失效,导致全表扫描(很重要)

禁止在where条件列使用函数或者表达式

  • 导致不能命中索引,全表扫描

禁止负向查询以及%开头的模糊查询

  • 导致不能命中索引,全表扫描

禁止大表join子查询

同一个字段上的or必须改写为inin的值必须少于50个

应用程序必须捕获SQL异常(方便定位线上问题)

课后思考:为什么select uid from user where phone=13811223344不能命中phone索引?

课后拓展:

MyISAM与InnoDB两者之间区别与选择https://www.cnblogs.com/y-rong/p/5309392.htmlhttps://www.cnblogs.com/y-rong/p/8110596.html了解下Mysql的间隙锁及产生的原因https://www.cnblogs.com/wt645631686/p/8324671.htmlgrant授权和revoke回收权限https://www.cnblogs.com/kevingrace/p/5719536.htmlcentos7自带数据库MariaDB重启和修改密码https://blog.csdn.net/shachao888/article/details/50341857MySQL添加用户、删除用户与授权https://www.cnblogs.com/wanghetao/p/3806888.html深度认识 Sharding-JDBC:做最轻量级的数据库中间层https://my.oschina.net/editorial-story/blog/888650

原文出处:https://www.cnblogs.com/dotnetcrazy/p/9887708.html  

0人推荐
随时随地看视频
慕课网APP