前言
2019年,做大数据开发已经6年了,这期间分布式系统的知识学习了不少,但基本都是由于项目需要,没有系统性的融会贯通提纲挈领,在一件小事的触动之下,决定系统性的学习分布式系统。
网上搜索“如何系统性的学习分布式系统”,得到的答案都不是很满意,比如有的知识点过于零散,没有主线贯穿,有的太偏学术,都是看不懂也不知道有什么实际作用的算法。
因此决定自己列一个提纲,梳理一下分布式系统的知识,以分布式系统的特性为出发点,着重分析一些比较常用的开源软件中的实现原理,注重工程实践,减少理论研究,以设计思路为研究对象,便于自己的学习,也希望帮助他人。
具体学习路线
学习一项技术,要看它解决了什么问题,为了解决这个问题,它又具有哪些特性,这些特性又分别如何实现。
分布式系统解决什么问题就不过多解释了,无非是单一的节点无法满足业务需求,需要多节点协同工作。
一个分布式系统,具备以下特性:
- 一致性。分布式系统整体对外表现出的一致性由它的一致性模型决定。
我们将会学习这些一致性模型:
Sequential Consistency
Causal Consistency
Linearizability
Session Guarantees for Weakly Consistent Replicated Data
以及相关数学知识,也会研究一些分布式系统:
zookeeper
mongodb - 时钟。系统通过事件发生的时间确定先后顺序。
我们将会学习这些时钟:
Lamport逻辑时钟
Vector clock
True Time - 共识。分布式系统具备达到共识的能力。(计划介绍一些共识算法,例如raft)
- 扩展性。(计划介绍一些提高系统扩展性的东西,比如一致性hash)
这应该会是一个持续更新的路线图,同时也欢迎大家的意见和建议。
如何系统性的学习分布式系统?