混沌工程赋能:规模化地应对上云后的未知暗债
版权声明
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
吾真本说混沌工程
扫码关注公众号
扫码阅读
手机扫码阅读
企业上云后遭遇未知暗债
企业在上云过程中,会面临系统复杂性增加导致的暗债问题,这些暗债是不可见的系统异常,只能在发生故障时被感知。
混沌工程要解决的问题
混沌工程起源于Netflix遭遇上云后的暗债问题,通过故障注入实验“混沌猴”规模化应对暗债,提高系统稳定性。
混沌工程赋能的核心
混沌工程的核心在于规模化地赋能开发团队,使其全面理解复杂系统的运作和失效方式,强化系统稳定性设计。
为混沌工程赋能创造好的条件
创建好的混沌工程赋能条件包括服务分级、责任分配、质量内建、生产环境验证、架构文档、故障监控工具、系统稳定性度量、灾难恢复计划、服务等级目标、故障预算、值班机制和混沌工程实验等12件事。
混沌工程的成效度量
混沌工程的成效度量可以借鉴Kirkpatrick模型,该模型是教育领域的一种成效评估工具。
混沌工程赋能的过程
混沌工程赋能过程包含成立赋能团队、选择试点服务、混沌工程实战营、挑选种子、现状调研、导入理念、沉淀案例、案例分享和优化过程等9个步骤。
总结
混沌工程是规模化赋予开发团队系统稳定性的活动。通过解决早期大众的痛点,实现从早期采纳者到早期大众的过渡,逐步规模化。
吾真本说混沌工程
吾真本说混沌工程
扫码关注公众号
还在用多套工具管项目?
一个平台搞定产品、项目、质量与效能,告别整合之苦,实现全流程闭环。
查看方案
吾真本说混沌工程的其他文章
K8S下所用的Istio就是检验微服务稳定性的混沌工程开源工具
在K8S上部署的微服务,经常会依赖不受你控制的其他微服务。当两者之间的HTTP交互出现延迟或错误后,你的微服务能否按预期正常工作?应该做一个故障注入实验来检验。如果在K8S上使用了Istio,那么恭喜,你已拥有了简单易用的混沌工程开源工具。
听见呼救无人报警与持续集成流水线红色告警无人理会
开发团队持续集成流水线纪律落地的实际成效,还取决于在同一流水线上工作的开发人员数量。数量越少,效果越好。在同一流水线上工作的开发人员,意味着他们的代码最终都会合并到这条流水线上。
做软件的人不被他人忽悠的唯一方法
读书虽然能很快得到结论,但难以说明结论一定适用于你,且难以揭示结论背后的原因。访谈只能揭示相关性,无法揭示因果性。相关性不等同于因果性。揭示因果性的唯一方法,就是用科学方法做实验。
DevOps编程操练:用Jenkins流水线建立代码质量预警机制
解决痛点代码上线故障多不知如何用docker搭建Jenkins操练环境不知如何开始为Java代码编写自动化单
预防为主,何以为辅?——《混沌工程》译者序
在承认暗债本固有的前提下,设计安全的方法来做“不按常理出牌”的实验,以考验软件系统的稳定性,以促进“快速发现和修复故障”,从而有效地对“预防为主“的质量内建进行补充。这种工程实践,就是混沌工程。
加入社区微信群
与行业大咖零距离交流学习
PMO实践白皮书
白皮书上线
白皮书上线