做了个分析名字含义的小网站,希望各位给点建议 |
为了让亿万用户使用到稳定可靠的服务,Google 组建了一支专业的团队负责运行这些后端服务,这些工程师有一个共同的名字:Site Reliability Engineer。了解 Google SRE 的人常说的一句话是:和你们相比,大部分公司还处于刀耕火种时代,什么时候你们这些最佳实践能够帮助帮助其他的公司呢?资深 Google SRE Chris Jones 等人联合撰写了《Google SRE: How Google runs production systems》(以下简称《Google SRE》),首次向外界解密了谷歌的生产环境。前 Google 资深 SRE ,现 Coding.net CTO 孙宇聪 先生担任了本书译者。
随着这本官方书籍的出版,Google 毫无保留的将自己十几年 SRE 的生产管理经验分享出来,业界可以近距离全方位地了解到 Google SRE 的工作内容及最佳实践,这对整个互联网行业的影响将是巨大和深远的。
本书内容包括:
- 如何平衡可用性和成本
- 如何制定服务的 SLO
- 如何减少 operational 的工作
- 分布式系统的监控
- 自动化平台演进
- SRE 在软件发布中的角色
本书首度系统性披露 Google SRE 之道,集 Google SRE 理论和实践之大成,可谓运维宝书。从 SRE 的视角来看 Google 生产环境会是怎样?且听本文分解。
未完,阅读全文请点击:https://zhuanlan.zhihu.com/p/22354002
过早客微信公众号:guozaoke • 过早客新浪微博:@过早客 • 广告投放合作微信:fullygroup50 鄂ICP备2021016276号-2 • 鄂公网安备42018502001446号