SRE原理与实践:构建高可靠性互联网应用
上QQ阅读APP看书,第一时间看更新

Foreword
推荐序1

2016年,我有幸将《SRE:Google运维解密》一书引进中国并参与了它的翻译。自此以后,SRE理念在中国科技圈扎根立足,得到了长足发展。伴随着互联网的蓬勃发展,中国的互联网公司在直播、电商等领域开辟了一条新的赛道,逢山开路,遇水架桥,解决了数不清的技术难题,获得了宝贵的技术实践经验。这些技术经验与SRE理念相结合,值得我们一起学习和推广。

采用SRE理念的最终目的是提高系统的可靠性。这不仅需要方法论,更需要具体的实践指导。我有幸提前阅读了本书的部分内容,受益良多。本书从互联网行业内“可靠性”的定义开始,详细阐述了如何定义可靠性、如何设计可靠的系统,以及如何将业务可靠性的要求应用到具体的系统设计过程等话题,还讲述了提高可观测性、提高故障修复能力、消除系统脆弱性等方面的具体实践,这些都是非常实用的内容。我认为这本书作为中国互联网技术发展历史中的精彩一章,值得每一个SRE从业人员阅读、学习和收藏。

——孙宇聪《SRE:Google运维解密》译者