扫码阅读
手机扫码阅读
如何做好线上服务质量保障

多可用区多机房 |
发现线上故障
处理线上故障
修复线上故障
服务重启; 部署回滚; 限流降级;
利用日志和故障现场保留的dump文件等进行根因分析; 修复故障后在测试环境进行验证,确认没问题后再发布到生产环境; 记录故障从发生到彻底修复的全过程,进行线上故障复盘,提出后续改进方案并跟进落地;
组织线上故障演练,培养技术同学的临时反应和处理问题能力; 通过灰度发布或者发布beta版本,让用户成为帮助我们发现问题; 做专项的混沌工程,在不断的攻防演练中提升线上服务的质量和稳定性;
运营线上质量
原文链接:
http://mp.weixin.qq.com/s?__biz=Mzg2NDAwMjM1NQ==&mid=2247486225&idx=1&sn=f35d400f91923a3877b7eed298241dfb&chksm=ce71434df906ca5baf1125326f26cfe9fe7227f75f1575204cf8f01e906e8899bd454cfad640#rd
老张的求知思考世界的其他文章
加入社区微信群
与行业大咖零距离交流学习


软件研发质量管理体系建设
白皮书上线