感谢 --- ByteByteGo
嘿,开发者们,如果你设计过分布式系统和软件,你可能会知道系统设计是关于做出关键决策来平衡各种权衡,这些决策会影响系统的功能、性能和可维护性。
这有助于工程师和系统设计师在构建或扩展系统时做出实用的选择,以满足业务和技术上的需求。
之前,我分享了许多流行的系统设计问题,例如之前分享的API Gateway 和 Load Balancer 的区别和水平扩展与垂直扩展的区别,正向代理与反向代理的区别,以及50个系统设计问题。今天,我们将深入探讨每位技术人员都应该知道的15个关键的系统设计取舍。
不论你是学系统设计还是准备系统设计面试,这些权衡点将帮助你回答问题,并帮助你在面试中更好地解释你的选择和设计方案。
不过,如果你正在为面试准备而学习这些概念,我也建议你查看下面这些网站,如ByteByteGo,Design Guru,Exponent,Educative,Codemia.io,InterviewReddy.io 和 Udemy,这些网站有很多优秀的系统设计课程,你可以去看看。
此处省略
15 系统设计折中要点:有经验的开发人员及软件架构师废话少说,以下是一份我认为在设计实际中的系统时至关重要的15个系统设计权衡。了解这些将有助于你更好地架构一个能经受住生产环境中时间考验的系统。
1: 水平扩展和垂直扩展的差异
向上扩展,或称为垂直扩展,是指通过增加现有服务器的CPU、RAM或存储容量来提升其性能。
虽然它很简单,但是有其限制。水平扩展,也就是向外扩展,意味着增加更多的服务器来分散负载。
尽管这种方法理论上可以应对无限的增长,但需要对分布式系统进行细致管理,并可能带来如数据一致性和负载均衡等问题。
此处省略内容
2. 有状态架构与无状态架构
状态保持系统会维护会话数据,为用户提供上下文信息,但它们可能更难扩展和管理,因此在使用时需要更多的维护。
无状态的系统将每个请求都视为独立的,这使它们更容易扩展,但每个请求都必须包含所有需要的信息。
此处省略部分内容
*注:此处内容省略。*
3: 延迟 vs. 吞吐
延迟时间是指处理单个任务所需的时间,吞吐量是指在给定时间段内处理的任务总数。
优化延迟时间意味着优先快速响应,适合应用于在线游戏或高频交易系统等场景。
相反,在这种情况下,优化吞吐效率是理想的选择,目标是在单位时间内处理尽可能多的数据。
此处为空
4. SQL 与 NoSQL 数据库的区别
像MySQL和PostgreSQL这样的SQL数据库,结构化且强制执行严格的模式,因此非常适合复杂查询和确保ACID特性。
NoSQL数据库,如MongoDB和Cassandra,更适合非结构化或半结构化数据,提供更大的灵活性、可扩展性和速度。选择则依赖于数据模型、一致性需求和应用程序的扩展需求。
此处省略内容
5. 一致性 VS 可用性(CAP 理论)
另一个重要的系统设计概念和取舍,资深工程师应该记住。
根据CAP定理,一个分布式系统只能保证任意两个属性:一致性、可用性、分区容错性。
一致性确保所有节点看到相同的数据,而可用性则意味着系统始终可用。也就是说,一致性保证了数据的一致性,而可用性保证了系统的持续运行。
在金融交易中,一致性比可用性更重要,而在社交媒体动态中,可用性可能更被优先考虑。
6. 强一致 vs 最终一致
强一致性保证了数据在所有节点之间的实时同步,这对于金融系统来说非常重要。
最终一致允许数据在各节点间更新时有轻微延迟,从而提升性能和可用性。
这种方法适用于可以暂时接受不一致的做法,比如在社交媒体上的更新。
7. 读取缓存和写入缓存的差别
在读取未命中的情况下,数据被加载到缓存中。这种方法减少了缓存污染的可能性,但可能会增加未命中缓存的数据的延迟。
在写穿缓存(Write-through缓存)中,数据会同时写入缓存和数据库,确保一致性,但会牺牲写入性能。
(点击图片查看详情)
8. 同步处理与异步处理的区别
同步处理要求每个任务先完成,下一个任务才能开始,这可能会导致效率低下进而出现卡顿。
例如,异步处理允许多个任务同时进行,减少了等待时间并提高了系统的响应速度,适用于非阻塞I/O操作或并行计算。
9. 批处理与流式处理
批处理将数据分块处理,非常适合处理类似薪资这样的数据,整个数据集会被一次性处理。
流处理技术处理不断流动的数据,非常适合实时数据分析,其中即时处理数据非常重要。
10. 可扩展性与性能
可扩展性就是系统能够通过增加资源来处理越来越多的工作。性能是指系统处理任务的快慢。
通常,增强可扩展性可能会导致性能下降,由于这些额外的开销,例如网络延迟和数据同步。
因此,我们需要在增加用户量和保持快速响应之间找到平衡。
11. 长轮询 vs. WebSocket
长时间轮询让客户端能够等待来自服务器的数据,这种方法会占用大量资源并可能会导致延迟。
WebSocket提供持久的双向通信连接,从而实现实时数据交换。
这非常适合聊天系统或实时仪表板这类需要不断更新的应用程序。
WebSockets的另一个好处是它们运行在HTTP使用的80端口,因此几乎总是保持开放状态。你无需在防火墙上再开新端口,这意味着你不必跟网络团队打交道,少了很多麻烦。
12. 标准化 vs. 非标准化
数据规范化通过将数据拆分到相关表格来减少数据冗余并提高数据完整性。
不过,这可能导致复杂的连接操作和较慢的读取。
去规范化将数据合并到更少的表中,从而提高读取速度,但会因此产生冗余数据,这会使更新和维护变得更加复杂。
13. 单体架构 vs. 微服务架构
这种取舍无疑是在系统设计的面试中最关键的因素之一。
单体架构指的是单一的、统一的代码库,简化了开发和部署过程,但给扩展规模和维护带来了挑战。
微服务架构将系统拆分为独立的服务,从而实现了更好的可扩展性和灵活性,但同时也带来了操作复杂性的增加。
14. TCP 与 UDP
软件开发中的经典取舍。
TCP 适用于可靠、有序并经过错误检查的数据传送,适合用于如网页浏览和文件传输。
相比之下,UDP 提供更快的无连接传输,但不保证数据传输的可靠性和顺序,使其成为在线游戏或视频流等应用的理想选择,在这些应用中,速度非常关键,偶尔丢失一些数据是可以接受的。
15. REST 和 GraphQL
REST使用标准的HTTP方法和端点,这些方法和端点简单且具有良好的扩展性,但可能会导致数据获取过多或不足。
相比之下,GraphQL 让客户端能精准获取所需数据,减少了传输的数据,从而提升了性能,特别是在处理复杂或嵌套数据时。
12 最好的系统设计面试相关资源:
这里有一份精心挑选的 最佳系统设计书籍、在线课程 以及练习平台 列表,你可以参考这些资源来更好地准备系统设计面试。这些课程中的很多也会解答这里提到的问题。
-
DesignGuru的系统设计课程:一个互动式学习平台,包含动手实践和真实世界场景,可以提升您的系统设计能力。
-
Codemia.io: Codemia.io 是一个很好的平台,可以用来练习面试中的系统设计问题。它有超过120个系统设计问题,大多数是免费的,并且这些题目都有一个合理的结构来帮助解决。
-
ByteByteGo:由 Alex Xu 编写的实时更新的书籍和课程,帮助准备系统设计面试。它包含了《系统设计面试》第一卷和第二卷的内容,并将很快加入第三卷的内容。
-
Exponent: 一个专门帮助面试准备的网站,特别是针对亚马逊、谷歌等FAANG公司。他们还提供了一个很棒的系统设计课程和许多其他资源,这些资源可以帮助你通过FAANG的面试。
-
Alex Xu 的《系统设计面试》: 这本书介绍了系统设计的基本概念、策略和面试准备技巧。
-
这本书《设计数据密集型应用》](https://amzn.to/3nXKaas) 作者马丁·克雷普曼:一本详尽的指南,介绍了设计可伸缩和可靠系统的原理与实践。
-
LeetCode 系统设计部分:LeetCode 是一个流行的平台,用于准备技术面试,该平台上的系统设计部分包含各种练习题。
-
"系统设计入门指南" 在 GitHub 上的:精选资源列表,包括文章、书籍和视频,帮助你准备系统设计面试的资源。
-
点击这里了解更多Educative的系统设计课程: 一个包含实际操作练习和真实案例的互动性强的学习平台,可以提高你在系统设计方面的技能。
-
高扩展性博客——一个专注于高流量的网站和可扩展系统架构的文章和案例研究的博客。
-
YouTube 频道:可以关注比如 "Gaurav Sen" 和 "Tech Dummies" 这样的频道,可以找到关于系统设计概念和面试准备的深入视频。
- InterviewReddy.io: 这个网站是由前谷歌的工程师 Gaurav Sen 创建的,他也是 System Design 简化课程的 YouTube 制作人。如果你想准备面试 FAANG,也可以去这个网站看看。
图片来源 --- ByteByteGo
你还应该记得将理论知识与实际应用结合起来,通过参与实际项目和模拟面试练习。持续的练习和学习会给你在系统设计面试中的信心。
以下是关于每个开发人员都需要了解的15个系统设计中的关键权衡。理解这些系统设计的权衡对架构师和开发人员来说至关重要,它们是设计出这样的系统的关键:稳健、可扩展且易于维护的系统。
通过权衡每种方法的利弊,人们可以做出符合技术和业务的需求的明智的决定。
无论你是为了性能、可扩展性还是一致性要求进行优化,,认识到这些权衡点将有助于你构建更优秀的系统,以满足用户期望并应对未来的增长。
祝你的面试顺利!加油!