不增加成本能更好应对生产系统稳定性意外故障的“开发测试运维三岗转为系统红蓝军”实验

实验团队系统蓝军运维

发布于 2023-08-26

1613

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：不增加成本能更好应对生产系统稳定性意外故障的“开发测试运维三岗转为系统红蓝军”实验

文章来源：

吾真本说混沌工程

扫码关注公众号

扫码阅读

手机扫码阅读

文章摘要

系统红蓝军对提升软件系统稳定性的影响

系统红蓝军的实施能够引导开发人员进行有效的功能自测，并有助于企业在不增加成本的情况下提高对生产系统稳定性意外故障的应对能力。

生产环境稳定性故障的常见问题

企业软件系统在生产环境中频繁遭遇稳定性故障，这些故障通常超出预期。

故障原因分析

此类故障的发生，往往源于管理者和工程师的心理特点，包括过度自信、确认性偏见、从众效应和注意力分散。

红蓝军机制的作用

建立红蓝军机制有助于克服上述心理特点，通过开发、测试和运维人员在红蓝军中的角色转变，实现了职责的明晰化和协作的优化，减少了意外故障并提高了故障修复的效率和质量。

实验设计与实施

作为企业IT部门开发团队负责人，需要设计一项实验来验证红蓝军机制的效果。实验包括设置对照组和实验组，保密实验细节以确保数据的准确性，同时采集关键指标如平均故障间隔时间(MTBF)和平均停机恢复时长(MTTR)。实验期间，对照组维持常规职责分配，而实验组则采用红蓝军的新机制。

实验将在半年的时间内进行，每两个月为一个迭代周期，期末分析比较数据，并不断迭代优化假设和实验过程。通过实验数据分析，验证红蓝军机制的有效性，并鼓励改进实验方法。

结语

文章最后呼吁读者参与改进实验，并分享文章，以促进更广泛的讨论和研究。作者表示愿意倾听读者的意见，并期待读者的反馈。

吾真本说混沌工程

查看原文：不增加成本能更好应对生产系统稳定性意外故障的“开发测试运维三岗转为系统红蓝军”实验

文章来源：

吾真本说混沌工程

扫码关注公众号

相关推荐

A/B实验，了解一下。

1112

实验分组指标样本

不会做的时候选C

产品增长|万字讲解增长理论与实践（下）

1377

实验增长产品小美

承接上篇，产品增长文章。

知乎商业市场负责人张炎：用实验带来讨论，用讨论带来信任

1181

实验产品知乎实验室

把复杂的产品力翻译成大家容易理解的用户产品体验。

聊聊混沌工程

1691

混沌工程实验系统

混沌工程是一门新兴学科，它不仅仅只是个技术活动，还包含如何设计能够持续协作的混沌实验。它由Neflix首先在实践中发现了混沌工程的商业价值，通过构建更有韧性的系统来抵御海量组件系统的意外失效

聊聊混沌工程的企业实践

1550

混沌工程实验

很多著名公司把混沌工程实验做成“Game Day”，用游戏比赛的有趣竞争状态来进行混沌实验，而不是制造如临大敌的气氛。本文详细介绍各大企业实践混沌工程的优秀流程，经验教训，人为阻力，人和组织的能力提升，从中学习到了哪些洞见

在不增加成本的情况下引导开发人员做好功能自测的“开发与测试岗位更名为系统红蓝军”实验

1453

开发实验测试人员开发人员

开发和测试人员的岗位，分别改名为*系统红军*和*系统蓝军*。系统红军需要对所设计和编写的软件特性在整个系统中正常运行负全责，而系统蓝军需要从整个系统的角度模拟现实生产环境各种刁钻的场景来考验系统红军所设计和实现的软件特性，能否正常运行，

吾真本说混沌工程

用好企业软件系统稳定性与混沌工程相关技术和过程。

34 篇文章

浏览 56.1K

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

查看方案

吾真本说混沌工程的其他文章

做软件的人不被他人忽悠的唯一方法

读书虽然能很快得到结论，但难以说明结论一定适用于你，且难以揭示结论背后的原因。访谈只能揭示相关性，无法揭示因果性。相关性不等同于因果性。揭示因果性的唯一方法，就是用科学方法做实验。

单件流over库存-伍斌_Ben访谈

2017年3月13日晚9～10:30，我将用Zoom app连线“AHA面对面”，来在线分享“动手搭建部署流水线来可视化软件开发的单件流”。

2016版编程操练神器Cyber-dojo的VMDK虚拟机镜像文件下载

经过Cyber-dojo的作者Jon Jagger的同意，我把在我电脑VirtualBox虚拟机中安装完毕的新版Cyber-dojo私有服务器的14GB大小的VMDK文件，切成14份，上传到云盘，供大家下载，能免去翻墙安装的痛苦。

如何识别度量数据中的改进信号

度量驱动改进活动中最大的痛点，就是搜集了一堆数据后，发现无法精确地识别哪些数据是改进信号，哪些数据是可以获取

领域驱动的微服务架构设计工作坊实施步骤

领域驱动的微服务架构设计工作坊，能使软件开发团队所有成员在短时间内，迅速就新产品或遗留系统的价值、用户画像、关键场景、聚合达成一致，以便让团队快速识别软件产品的问题域和解决方案域，并据此拆分微服务和团队，来开发新产品或重构遗留系统。

随机阅读

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询

不增加成本能更好应对生产系统稳定性意外故障的“开发测试运维三岗转为系统红蓝军”实验

版权声明

系统红蓝军对提升软件系统稳定性的影响

生产环境稳定性故障的常见问题

故障原因分析

红蓝军机制的作用

实验设计与实施

结语

Vibe Coding是什么？

还在用多套工具管项目？

联系我们

融实践库

微信公众号

微信视频号

社区微信群