混沌工程赋能:规模化地应对上云后的未知暗债
版权声明
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
吾真本说混沌工程
扫码关注公众号
扫码阅读
手机扫码阅读
企业上云后遭遇未知暗债
企业在上云过程中,会面临系统复杂性增加导致的暗债问题,这些暗债是不可见的系统异常,只能在发生故障时被感知。
混沌工程要解决的问题
混沌工程起源于Netflix遭遇上云后的暗债问题,通过故障注入实验“混沌猴”规模化应对暗债,提高系统稳定性。
混沌工程赋能的核心
混沌工程的核心在于规模化地赋能开发团队,使其全面理解复杂系统的运作和失效方式,强化系统稳定性设计。
为混沌工程赋能创造好的条件
创建好的混沌工程赋能条件包括服务分级、责任分配、质量内建、生产环境验证、架构文档、故障监控工具、系统稳定性度量、灾难恢复计划、服务等级目标、故障预算、值班机制和混沌工程实验等12件事。
混沌工程的成效度量
混沌工程的成效度量可以借鉴Kirkpatrick模型,该模型是教育领域的一种成效评估工具。
混沌工程赋能的过程
混沌工程赋能过程包含成立赋能团队、选择试点服务、混沌工程实战营、挑选种子、现状调研、导入理念、沉淀案例、案例分享和优化过程等9个步骤。
总结
混沌工程是规模化赋予开发团队系统稳定性的活动。通过解决早期大众的痛点,实现从早期采纳者到早期大众的过渡,逐步规模化。
吾真本说混沌工程
吾真本说混沌工程
扫码关注公众号
还在用多套工具管项目?
一个平台搞定产品、项目、质量与效能,告别整合之苦,实现全流程闭环。
查看方案
吾真本说混沌工程的其他文章
节省显示器同时提升持续集成问题修复及时性的“流水线问题责任聚焦”实验
如果将流水线健康显示屏撤掉,并要求每位开发人员,在向流水线合并代码后,需要通过自己的电脑显示器,观察流水线健康状态。直到状态变为绿色,才算合并成功。若其间发现红色/黄色告警,因为只有她/他一人在场,那么她/他主动修复问题的概率会达到最大。
OnD1: 微信朋友圈权限领域建模操练
距离上次我搞编程道场转眼快3年了。难以找到自己满意的操练题目是隔了这么久的主要原因。好在我最近终于找到了更感兴趣的方向和题目。这是改名后的第一次操练道场。欢迎参加!
K8S下所用的Istio就是检验微服务稳定性的混沌工程开源工具
在K8S上部署的微服务,经常会依赖不受你控制的其他微服务。当两者之间的HTTP交互出现延迟或错误后,你的微服务能否按预期正常工作?应该做一个故障注入实验来检验。如果在K8S上使用了Istio,那么恭喜,你已拥有了简单易用的混沌工程开源工具。
单件流over库存-伍斌_Ben访谈
2017年3月13日晚9~10:30,我将用Zoom app连线“AHA面对面”,来在线分享“动手搭建部署流水线来可视化软件开发的单件流”。
从“技术执男”到“技术暖男”
如果把不懂女性心思的理工男称为理工直男,那么就可以把不懂客户心思,片面执着于理想中的“最佳技术实践”的技术咨询师,称为“技术执男”。
加入社区微信群
与行业大咖零距离交流学习
PMO实践白皮书
白皮书上线
白皮书上线