最近一直都在写理论方面的东西,这篇也是理论,但这次也当做对ZooKeeper的一个小阶段总结,之前所提到的ZooKeeper都属于基础的部分,高级部分的进阶还需要一起共同探讨。
与文无关
最近更新ZooKeeper速度也相对快了一点,快的话质量不能保证太多,也有一点是学习新知识的时候,入门那段时间我们觉得最有收获,然后呢,需要一段时间的瓶颈期,再次进入高手阶段。
学习曲线
入门是人收获较多的时候,原本对一个东西不了解到突然知道原来有个东西可以做这个,做那个,心中就觉得收获很多。接下来呢,做东西不可能一直停留在入门的水平,我们需要不断的进步,但是发现中级的人员用到的也不过是新手的那些东西,中级的人不过是熟悉更多的参考文档,遇到问题的时候往哪里找资料。
前面写的一些ZooKeeper理论,不过是个参考,收获不会有那么多,但是想要进阶为更高级的人员总要经历一段时间的积累。
就不瞎扯了,这篇当做ZooKeeper初级的分割线,往下面再去写就试着写一些ZooKeeper高阶的内容。
这里我们学习分布式的理论相关内容。
常见的分布式理论:
2PC 两段式提交,较早的理论,有助于理解分布式理论
CAP与BASE理论 CAP为较重要的分布式理论之一
Paxos理论
理论
了解以下概念:
节点
通信
存储
异常,分布式系统要处理的核心问题,解决各种各样的异常
副本,贯穿整个分布式系统的理论核心。数据或服务冗余。
衡量分布式系统的直播
性能
可用性
一致性
扩展性
2PC
2PC,又称为两段式提交,最早提出来是用于数据库的事务,数据库的事务要满足ACID操作。2PC是一种 “中心化副本控制” 协议,参与的节点有两类,一是协调者节点,二是参与者节点。
两阶段提交的思路:
第一阶段,协调者询问所有的参与者是否可以提交事务(请参与者投票),所有参与者向协调者投票。
第二阶段,协调者根据所有参与者的投票结果做出是否事务可以全局提交的决定,并通知所有的参与者执行该决定。
在一个两阶段交提流程中,参与者不能改变自己的投票结果。两阶段提交协议的可以全局提交的前提是所有的参与者都同意提交事务,只要有一个参与者投票选择放弃(abort)事务,则事务必须被放弃。
2PC图
后面有衍生出了3PC,3PC的我的理解是在准备提交之前,再发送一个请求,问计算机是否正常工作,能不能执行事务操作。
CAP理论和Base理论
CAP三个字母分别代表了分布式系统中三个相互矛盾的属性:
Consistency (一致性):CAP理论中的副本一致性特指强一致性;
Availiablity(可用性): 指系统在出现异常时已经可以提供服务;
Tolerance to the partition of network (分区容忍):指系统可以对网络分区这种异常情况进行容错处理;
CAP理论指出,系统不可能同时满足三折,最多只能同时满足其中的两项。
CAP理论
BASE是Basically Availaible(基本可用),Soft state(软状态),和Eventually consistent(最终一致性)三个短语的简写。它是由CAP逐步演化来的,核心思想是:
即使无法做到强一致性,但每个应用可以根据自身业务特点,采用适当的方式是系统达到最终一致性。
软状态指的是系统中数据的中间状态,中间状态的存在不会影响系统的整体可用性。
Paxos理论
Paxos协议是少数在工程实践中证实的强一致性、高可用的去中心化分布式协议。
Paxos协议的流程较为复杂,但基本思想类似人类投票过程。
Paxos协议中,有一组完全对等的参与节点(称为accpetor),这组节点各自就某一事件做出决议,如果某个决议获得了超过半数节点的同意则生效。Paxos协议中只要有超过一半的节点正常,就可以工作,能很好对抗宕机、网络分化等异常情况。
Paxos具体的理论较为复杂,感兴趣的可以看Lamport的论文,或查看一些相关资料...
额外
数据库的隔离级别:
未提交读(Read Uncommitted):允许脏读,也就是可能读取到其他会话中未提交事务修改的数据。
提交读(Read Committed):只能读取到已经提交的数据。Oracle等多数数据库默认都是该级别 (不重复读)。
可重复读(Repeated Read):可重复读。在同一个事务内的查询都是事务开始时刻一致的,InnoDB默认级别。保证在事务处理的过程中,多次读取同一个数据,其值都和事务开始时刻是一一致的。
串行读(Serializable):完全串行化的读,每次读都需要获得表级共享锁,读写相互都会阻塞。
最后
刚开始瞎侃了一下,下面对分布式的理论做了简单说明,未深入讲解。最后提了一下数据的隔离级别。
参考
《分布式系统原理介绍》
《从Paxos到ZooKeeper-分布式一致性原理与实践》