本文是我自己在秋招复习时的读书笔记,整理的知识点,也是为了防止忘记,尊重劳动成果,转载注明出处哦!如果你也喜欢,那就点个小心心,文末赞赏一杯豆奶吧,嘻嘻。 让我们共同成长吧……
第1章 MySQL体系结构和存储引擎
1.1 定义数据库和实例
数据库:物理操作系统文件或其他形式文件类型集合。mysql中数据库文件可以是frm、MYD、MYI、ibd结尾的文件。
实例:mysql数据库由后台线程以及一个共享内存区组成。数据库实例才是正真操作数据库文件的。
MySQL是一个单进程多线程架构的数据库。MYSQL数据库实例在系统上的表现是一个进程。
1.2 MySQL体系结构
从概念上讲,数据库是文件的集合,是按照某种数据模型组织起来并存放在二级存储器中的数据集合;数据库实例是程序,用户通过数据库实例与数据库打交道。
MySQL体系结构:连接池组件、管理服务和工具组件、SQL接口组件、查询分析器组件、优化器组件、缓冲组件、插件式存储引擎、物理文件。
注意:存储引擎是基于表的,不是基于数据库的
1.3 MySQL存储引擎
1.3.1 InnoDB存储引擎
InnoDB存储引擎支持事务、支持行级锁、支持外键、支持非锁定读、MySQL5.5.8之后的默认存储引擎、支持MVCC获取高并发性、实现了SQL的4中隔离级别(默认repeatable)、使用next-key locking策略避免幻读产生、提供了插入缓冲、二次写、自适应哈希索引、预读、采用聚集方式存储数据。
1.3.2 MyISAM存储引擎
MyISAM不支持事务、支持表级锁、支持全文索引、面向OLAP数据库应用、缓冲池中指存储索引文件,不缓冲数据文件,MyISAM存储引擎表由MYD和MYI组成。
1.3.3 其他储存引擎
NDB(集群存储引擎)、Memory(默认使用哈希索引)、Archive、Federated、Maria等。
1.4 各存储引擎之间的比较
1.5 连接MySQL
连接MySQL操作是一个连接进程和MySQL数据库实例进行通信。本质上是进程通信。进程通信方式:管道、命名管道、命名字、TCP/IP套接字、UNIX域套接字。
第2章 InnoDB存储引擎
InnoDB是事务安全型MySQL存储引擎,是OLTP应用首选的存储引擎。
2.1 InnoDB存储引擎概述
2.2 InnoDB存储引擎的版本
2.3 InnoDB体系架构
InnoDB存储引擎体系架构由:后台线程、内存池、和数据库文件组成。
内存池:维护所有进程/线程需要访问的多个内部数据结构;缓存磁盘上的数据,方便读取;重做日志缓冲……
后台线程:负责刷新内存池中的数据,保证缓冲池中的内存缓存是最近的数据;将已修改的数据文件刷新到磁盘文件,同时保证在数据库发生异常的情况下InnoDB能恢复到正常运行的状态下。
2.3.1 后台线程
InnoBD是多线程模型,后台的不同线程负责处理不同任务。
1、Master Thread
主要负责将缓冲池中的数据异步刷新到磁盘,保证数据的一致性,包括脏页的刷新、合并插入缓冲、undo页的回收等。
2、IO Thread
InnoDB使用了大量的AIO处理写IO请求,极大提高了数据库性能,IO Thread主要负责这些IO请求的回调处理。
3、Purge Thread
负责回收已经使用并分配的undo页。
4、Page Cleaner Thread
将脏页刷新操作放在单独的线程中执行。目的是为了减轻Master Thread的工作以及对于用户查询线程的阻塞。
2.3.2 内存
1、缓冲池
InnoDB是基于磁盘存储的,将其中的记录按照页的方式进行管理。缓冲池用来弥补磁盘速度相对于内存慢对数据库性能的影响。
缓冲池中缓存的数据页:索引页、数据页、undo页、插入缓冲、自适应哈希索引、InnoDB存储的锁信息、数据字典信息等。
InnoDB内存数据对象:缓冲池(索引页、数据页、插入缓冲、自适应哈希索引、InnoDB存储的锁信息、数据字典信息等)、重做日志缓冲、额外内存池。
允许有多个缓冲池实例,每个页根据哈希值分配平均分配到不同缓冲池实例中,这样做减少了数据库内部的资源竞争,增加数据库并发处理能力。
2、LRU List、Free List和Flush List
数据库中的缓冲池是通过LRU算法进行管理的。InnoDB缓冲池中的页默认16KB。InnoDB对LRU进行了优化,在LRU列表中加入了midpoint位置,读取最新的页是放在该位置,默认是LRU长度的5/8处。
3、重做日志缓冲
InnoDB首先将重做日志信息放到该缓冲,然后按照一定频率将其刷新到重做日志文件。默认8MB.
4、额外的内存池
2.4 Checkpoint技术
Checkpoint(检查点)技术目的是解决如下问题:缩短数据库的恢复时间;缓冲池不够用时将脏页刷新到磁盘;重做日志不可用时刷新脏页。
2.5 Master Thread 工作方式
2.6 InnoDB关键特性
插入缓冲、两次写、自适应哈希索引、异步IO、刷新邻接页。
2.6.1 插入缓冲
1、Insert Buffer
由于B+树的特性决定了非聚集索引插入的离散性,因而InnoDB设计了Insert Buffer,对于非聚集索引的插入或者更新操作,不是每一次都直接插入到索引页中,而是先判断插入的非聚集索引页是否存在缓冲池中,若在,则直接插入;若不在,则先放到Insert Buffer对象中。
Insert Buffer的使用满足:索引是辅助索引,索引不是唯一的。当满足这两个条件InnoDB才会使用Insert Buffer,这样能提高插入操作的性能。
insert buffer 也是B+树实现的。
2、Change Buffer
可以看做是Insert Buffer的升级。可以对insert、delete、update进行缓冲,分别是:Insert Buffer、Delete Buffer、Purge Buffer。
Change Buffer也要求索引是非唯一的辅助索引。
2.6.2 两次写
两次写保证InnoDB数据页的可靠性。
当应用重做日志前,用户需要一个页的副本,当写入失效时,先通过页的副本还原该页,再进行重做,这就是两次写。
两次写组成:一部分是内存中的doublewrite buffer(2MB),另一部分是物理磁盘上共享表空间中连续的128个页,即2个区,大小也是2MB.2.6.
2.6.3 自适应哈希索引
InnoDB会监控对各索引页的查询,如果发现建立哈希索引可以提升速度,则建立哈希索引,这就是自适应哈希索引(AHI)。AHI通过缓冲池的B+树页构造而来。AHI要求对这个页的连续访问模式必须是一样的。、,并且以该模式访问了100次,页通过该模式访问了N次(N=页中记录*1/16)
2.6.4 异步IO
2.6.5 刷新邻接页
当刷新一个脏页时,InnoDB会检查该页所在的区的所有页,如果是脏页,那么一起进行刷新。
2.7 启动、关闭与恢复
第3章 文件
本章介绍MySQL数据库和InnoDB存储引擎的各种类型文件。
参数文件:告诉MySQL数据库实例在哪里可以找到数据库文件,并且指定某些初始化参数等;
日志文件:用来记录MySQL实例对某种条件作出的响应时写入的文件,例如:错误日志文件、二进制日志文件、慢查询日志文件、查询日志文件;
socket文件:当用UNIX域套接字方式进行连接时需要的文件;
pid文件:MySQL实例的进程ID文件;
MySQL表结构文件:用来存放MySQ表结构定义文件;
存储引擎文件:存储引擎真正存储了记录和索引等数据。
3.1 参数文件
MySQL数据库的参数文件是以文本方式进行存储的。
3.1.1 什么是参数?
数据库参数可以看成一个键值对。
3.1.2 参数类型
MySQL数据库中参数分为:
动态参数:可以在MySQL实例运行中进行更改。
静态参数:在整个实例生命周期内都不能更改。
3.2 日志文件
日志文件记录了影响MySQL数据库的各种类型活动。MySQL常见文件:错误日志文件、二进制日志文件、慢查询日志文件、查询日志文件。
3.2.1 错误日志
错误日志文件对MySQL的启动、运行、关闭过程进行记录。可以得到进行数据库优化的信息。
3.2.2 慢查询日志
慢查询日志可以定位可能存在问题的sql语句,从而进行sql层面的优化。
3.2.3 查询日志
查询日志记录了所有对MySQL数据库请求的信息,无论这些请求是否得到正确的执行。
3.2.4 二进制日志
二进制日志记录了对MySQL数据库执行更改的所有操作,不包括select、show这类操作。
二进制日志作用:恢复、复制、审计。
3.3 套接字文件
3.4 pid文件
3.5 表结构定义文件
MySQL数据的存储是根表进行的,每个表都会与之对应的文件。MySQL中以frm为后缀的文件,记录了表的表结构定义,frm还用来存放视图的定义。
3.6 InnoDB存储引擎文件
之前介绍的文件都是MySQL数据库本身的文件,和存储引擎无关。与innoDB存储引擎相关的文件有:表空间文件、重做日志文件,
3.6.1 表空间文件
InnoDB采用将存储的数据按照表空间进行存放的设计。默认10MB,名为ibdata1.
3.6.2 重做日志文件
第4章 表
4.1 索引组织表
在InnoDB存储引擎中,表都是根据主键顺序组织存放的,这种存储方式的表称为索引组织表。若是创建表没有显示定义主键,InnoDB会将表中的第一个非空唯一索引设置为主键,若是没有非空唯一的索引,InnoDB自动创建一个6字节大小的指针。
4.2 InnoDB逻辑存储结构
InnoDB存储引擎将所有的数据存储在表空间中。InnoDB逻辑存储结构:表—段—区—页—行
4.2.1 表空间
表空间是InnoDB所有数据存放的地方。
4.2.2 段
表空间由各个段组成,常见的段有数据段、索引段、回滚段等。数据段就是B+树的叶子节点,索引段就是B+树的非索引节点。
4.2.3 区
区是由连续页组成的空间,在任何情况下每个区都是1MB。为了保证区的连续性,通常InnoDB申请4~5个区。默认页是16kB,即一个区中有64个连续页。
4.2.4 页
页(块)是InnoDB磁盘管理的最小单位,默认16KB,也可以设置为4KB 、8KB、16KB.
常见的页类型:
数据页、undo页、系统页、事务数据页、插入缓冲位图页、插入缓冲空闲列表页、未压缩的二进制大对象页、压缩的二进制大对象页。
4.2.5 行
InnoDB是面向列的,也就是说数据是按行进行存放的。每个页存放16KB/2-200行的记录,就是7992行记录。
4.3 InnoDB行记录格式
InnoDB提供了Compact和Redundant两种格式来存放行记数据。
4.4 InnoDB数据页结构
InnoDB数据页组成:File Header(文件头)、Page Header(页头)、Infimun和Supremun Records、User Records(行记录)、Free Space(空闲空间)、Page Directory(页目录)、File Trailer(文件结尾信息)
4.5 Named File Formats机制
InnoDB通过Named File Formats机制来解决不同版本下页结构兼容性问题。
4.6 约束
4.6.1 数据完整性
关系数据库本身能保证存储的数据的完整性,不需要应用程序的控制。数据完整性有:实体完整性、域完整性(用户自定义完整性)、参照完整性.
InnoDB中的约束:主键约束、唯一约束、外键约束、默认约束
4.6.2 约束的创建和查找
4.6.3 约束和索引的区别
约束是逻辑的概念,用来保证数据的完整性;而索引是一个数据结构,既有逻辑上的概念,在数据库中还代表着物理存储方式。
4.6.6 触发器与约束
一个表最多创建6个触发器,分别为insert、update、delete、的before和after各定义一个。
4.7 视图
视图(View)是一个虚表,可以当做表使用,视图中只存放了定义不存放实际的数据,实际的数据还在基本表中。虽然视图是虚表,但是对视图的更新操作本质上是通过
作者:我是一禅呐
链接:https://www.jianshu.com/p/8fc93103d214