手记

分布式数据库进入实时时代,TiDB 5.0 带来了什么?

导语:2021 年 4 月 25 日——企业级开源分布式数据库厂商 PingCAP 正式发布面向企业级核心场景的 TiDB 5.0
版本。TiDB 5.0 在性能、稳定性、易用性等方面均取得了巨大进步,并在事务处理、高可用与容灾、安全合规等方面新增多项企业级特性,通过引入
MPP (Massively Parallel Processing,即大规模并行处理)架构成为具备完整 HTAP
能力的分布式数据库,为高成长企业和数字化创新场景提供一栈式数据服务平台。


2020 年以来,企业数字化转型进入深水区,我们可以看到越来越多的传统行业开始拥抱数字化转型。然而面对数据实时性、可靠性的高要求,传统通过数据库、中间件、大数据等多组件协同的异构数据栈暴露出上线难、维护成本极高等问题,严重阻碍企业数字化进程。

例如,传统企业缺少技术深度积累,难以驾驭专为互联网公司定制的技术方案,传统技术栈难以应对当下的新业务需求成为转型痛点。同时,面对实时业务越来越成为必须的趋势,尤其是对于风控、物流、金融、公共服务等业务,技术栈复杂度愈发增加,前台业务与离线数仓之间缺少良好的衔接,为传统行业带来了新的技术需求,比如:

  • 架构更简单、更像经典数据库
  • 可以应对不断膨胀的数据规模
  • 可以应对实时化所谓的不同作业模型

企业级开源分布式数据库厂商 PingCAP 自主设计、研发的开源分布式关系型数据库 TIDB 具备水平扩缩容、金融级高可用、实时 HTAP、云原生的分布式数据库、兼容 MySQL 5.7 协议和 MySQL 生态等重要特性。适合高可用、强一致要求较高、数据规模较大等各种应用场景,满足了传统企业的上述要求。而TiDB 5.0 版本的发布,在性能、稳定性、易用性等方面均取得了巨大进步,并在事务处理、高可用与容灾、安全合规等方面新增多项企业级特性,通过引入 MPP (Massively Parallel Processing,即大规模并行处理)架构成为具备完整 HTAP 能力的分布式数据库,为高成长企业和数字化创新场景提供一栈式数据服务平台。

具备完整 HTAP 能力的数据库

HTAP (Hybrid Transactional/Analytical Processing,即混合事务 / 分析处理)数据库能够在一份数据源上同时支撑在线事务处理(OLTP)和在线分析处理(OLAP)场景,避免了传统架构中在线与离线数据库之间大量的数据交互。权威调研机构 Gartner 认为, HTAP 数据库将成为数据库领域的重要发展趋势,一个集成的数据平台将会加速数字化转型。

作为一款企业级分布式数据库产品,TiDB 早在 1.0 版本就实现了 OLTP Scale(在线事务处理的规模化扩展),4.0 版本已经实现初步的 HTAP 能力,5.0 版本在原有 HTAP 引擎 TiFlash 的基础上引入 MPP 架构,提供与存储匹配的分布式计算引擎,进一步提升海量数据下的并行计算与分析能力。

通过与 TiDB-Server 共享 SQL 前端,实现解析器(Parser)和优化器的共享,TiDB 向业务提供一体化的入口,能够自动选择单机执行或 MPP 模式,并且将事务型和分析型的负载隔离,使得双方在高并发量压力下互不干扰。场景实测显示,在相同硬件配置和数据量下,MPP 有着数倍于 Greenplum 的执行速度。

此外,TiDB 5.0 基于分布式架构,支持云原生与多云,可以弹性扩展吞吐或存储,轻松应对高并发、海量数据场景,实现一栈式数据服务。企业级用户、互联网用户、SaaS 厂商和独立软件开发商都可以通过一套 TiDB 系统构建数字场景应用,而不必关注底层架构。

性能及稳定性获整体增强

TiDB 在设计之初便确定了成为企业级数据库的目标,其「分布式强一致性事务、在线弹性水平扩展、故障自恢复的高可用、跨数据中心多活」的技术架构,决定了它具备企业级核心数据库需要的关键特性。TiDB 5.0 在性能方面取得了巨大的进步,通过提供聚簇索引、异步提交事务、TiFlash MPP 等功能, 在 Sysbench 和 TPC-C 等 OLTP 基准测试中,获得均值 50% 的性能提升。

同时,TiDB 5.0 通过优化调度过程中对 I/O、网络、CPU、内存等资源的占用,大幅减少 QPS(每秒查询量) 因为资源被抢占而出现的性能抖动问题,在 TPC-C OLTP 的基准测试中,衡量 TPC-C tpmC 抖动标准差的值小于等于 2%。

更加开放的用户生态

PingCAP 成立之初就以开源作为核心战略,高度活跃的开源社区为 TiDB 产品发展带来了飞轮效应,TiDB 还是一个生态友好型的数据库,TiDB 5.0 集成了更丰富的大数据生态,新增 Kafka 连接器 、支持 S3 存储服务,并提供多个数据迁移、导入与共享组件,方便用户在异构环境使用 TiDB。

TiDB 凭借优秀的技术能力及完善的商业服务支持体系,帮助金融、互联网、零售、物流、制造、公共服务等行业用户构建面向未来的数据服务平台。目前,TiDB 已在全球超过 1500 家头部企业的生产环境中得到应用,包括中国银联、国家电网、理想汽车、中国邮政、顺丰速运、腾讯、Square(美国)、Dailymotion(法国)、Shopee(新加坡)、ZaloPay(越南)、BookMyShow(印度)等。

PingCAP 联合创始人兼 CTO 黄东旭表示:“一个真正的企业级数据库厂商应该把自己放在用户的角度去思考,无论是一个企业去购买数据库应对数字化挑战,还是一个工程师去面对数百台的数据库集群维护,我认为他们需要的就是“省心、放心、不担心”。TiDB 5.0 是一个里程碑版本,具备完整的 HTAP 能力,用户业务无论是事务型还是分析型,只要一套 TiDB 系统就可以应对数字化转型过程中“海量、实时、在线”的业务需求。

关于未来十年的发展趋势,黄东旭认为,未来一切的基础设施都会跑在云上,云的基础设施会变成新的基础设施。而基于云原生的数据库,提供更加智能化的服务,它天然包含 AI、大数据、云计算等能力,在带来更好体验的同时降低成本,这是当前线下数据库所不具备的。而类似云原生数据库等新一代的基础软件,只有基于云底层能力深度重构才能真正获取弹性的能力,“我们已经准备好重新出发”。
————————————————

版权声明:本文为CSDN博主「CSDN资讯」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/csdnnews/article/details/116148753

0人推荐
随时随地看视频
慕课网APP