序三
关系型数据库技术和产品经过半个世纪的发展,形成了千亿级美元的市场与成熟的生态,而且一直处于信息处理领域的核心地位。在“数据洪流”的压力下,以及人们对数据价值挖掘需求不断增长的情况下,数据库技术也在不断地发展和创新。过去10年,关系型数据库领域最大的变化是分布式化。在OLAP领域,基于通用硬件的MPP数据库已经开始大规模取代集中式架构的数据库产品,并显示出极强的技术和性价比优势。分布式数据库领域的“最后一个技术堡垒”和“大问题”无疑是:在OLTP核心交易领域,是否能够真正颠覆成熟的集中式架构技术和产品?最近这10年,对分布式数据库的研究不断深入,相关理论和技术层出不穷,一些有潜力和前景的技术与产品也崭露头角。然而,无论是在实现原理上,还是在软件工程上,分布式OLTP数据库都比集中式产品更加复杂且更具挑战性。
本书正是针对分布式OLTP数据库领域关键理论和架构实现方面的问题而创作的。其中既有对过去10年分布式系统中CAP和Paxos这两个最关键理论的解析,也有对分布式事务、数据存储引擎、SQL引擎这几个数据库产品中最关键组件的原理分析和实践总结,还有对业内开源和商业典型产品的优缺点分析。书中对下面几个新技术进行了深度剖析:分布式系统下的事务隔离级别、基于键-值的存储引擎优缺点、存算分离架构、基于Paxos的分布式一致性、CAP理论与分布式数据库实现的关系、乐观锁和悲观锁对应用的影响等。这些关键技术和原理对分布式数据库的实现至关重要。
真正的核心技术往往没有好坏之分,只看其是否能够满足时代和市场的需求。回归交易型数据库的“初心”,用户的刚性需求一直是:
1)可控的数据安全;
2)对应用透明的极致高可用(5个9以上);
3)能够灵活承载不同业务场景的动态扩展能力和自适应能力;
4)能够使用性价比高的通用硬件和操作系统;
5)能够实现企业级的SLA保障;
6)简单易用;
7)能够不断改进并适应新的硬件架构。
基于集中式架构的数据库产品经过50年的发展,除了上面的第3个和第4个需求外,其他需求已经基本得到了满足。而分布式OLTP数据库正好有可能满足第3个和第4个需求,当然其要想成为主流,在其他几个维度上也必须达到集中式架构产品的水平。这就需要相关从业人员除了要对分布式系统理论和原理有深刻理解外,还要在软件工程及产品质量等关键方面有很深的造诣。
本书内容涵盖了分布式技术领域与分布式OLTP数据库领域最新的理论研究和技术实现,无论是数据库内核的资深开发者和进阶者,还是分布式数据库的应用开发者,甚至包括学习数据库课程的在校学生,阅读本书都可以有很大收获。这是分布式数据库领域一本值得推荐的好书。
武新 博士
易鲸捷信息技术有限公司CEO
2021年6月