数据、现象与原因
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
一家公司分析了近两年的24个项目的缺陷发生率数据,这一率值是通过系统测试发现的缺陷个数与开发工作量的比值来计算的。数据经箱线图分析后,初步可见2013年的缺陷发生率似乎低于2012年,这可能让人推测2013年的开发质量有所提升。
然而,当使用卡方分析考虑年份与项目开发方式之间的关系时,结果显示2013年的项目中修改类项目较多,全新开发项目较少,与2012年的情况正好相反。统计量揭示了两个变量之间存在显著关联(Pearson 卡方 = 4.196, P 值 = 0.041;似然率卡方 = 4.332, P 值 = 0.037),暗示项目类型的不同可能是缺陷发生率变化的一个因素。
进一步的分析表明,全新开发的项目与修改类项目在缺陷发生率上存在显著差异,这表明缺陷发生率的降低并非因为2013年的质量改进措施更加有效,而是项目类型的差异所导致的。如果能获取全新开发项目与修改类项目的测试投入数据,或者两类项目的评审投入数据,可以进一步分析这些因素是否也对缺陷发生率有影响。
总结而言,数据分析提示在我们观察到某种现象时不应急于下结论,而应深入探究数据背后的真实原因,并注意到数据可能存在的误导性。
想要了解更多内容?
麦哲思科技(北京)有限公司总经理 敏捷性能合弄模型评估师 认证的Scrum Master 认证的大规模敏捷顾问SPC CMMI高成熟度主任评估师 COSMIC MPC,IAC 成员,中国分部主席