数据中存在的假象

发布于 2024-10-02

1321

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：数据中存在的假象

文章来源：

麦哲思科技任甲林

扫码关注公众号

扫码阅读

手机扫码阅读

在实施CMMI高成熟度的软件公司中，分析过程性能数据时，常出现无法证明理应相关的变量间的相关性，或者出现与假设相反的分析结果。这种现象引发了对相关性分析过程中存在的问题的探讨。

首先，根据经验和常识，人们通常会有以下假设：

假设1：高水平的测试人员比低水平的测试人员发现的BUG多。
假设2：高水平的开发人员犯的错误应该比低水平的开发人员少。

然而，在实际数据分析中，发现这两个假设并未得到支持。原因在于，软件公司在实践中通常采用以下策略：

策略1：关键模块由高水平开发人员开发，非关键模块由低水平开发人员开发。
策略2：高水平测试人员测试关键模块，低水平测试人员测试非关键模块。

这些策略导致了实际数据是有偏的样本，而不是随机样本。因此，历史数据显示发现的BUG数量与开发或测试人员的水平无关，这与假设1和假设2相矛盾。

为了证明这两个假设，需要进行实验，即在控制其他条件不变的情况下，观察测试人员和开发人员的水平对BUG数量的影响，并通过统计过程的性能数据来验证假设的正确性。

总结来说，当数据分析结果与常识不符时，我们应该深入分析原因，可能是由于样本选择的偏差所导致的。理解这一点对于正确解读性能数据和改进过程至关重要。

麦哲思科技任甲林

查看原文：数据中存在的假象

文章来源：

麦哲思科技任甲林

扫码关注公众号

相关推荐

假如数据治理像做菜一样

1172

不懂数据治理的司机不是好厨师

大数据&常用的技术结构

1216

数据 Hadoop 分布式 Hive

Hadoop的项目结构的主要部分，这些组件共同协作，为用户提供了大规模数据处理和存储的能力。

绝了！这个库让Pandas数据框互动起来了！

1324

关注和星标『数据STUDIO』，和云朵君一起学习数据分析与挖掘！

数据治理体系规划

1575

数据资料治理文档

【数据治理体系】公众号和您一起终身学习，一起持续完善【数据治理体系】

54页PPT | 2024数据分类分级标准解读及分类分级技术实践案例分享（附下载）

838

数据分级分类星球

本文通过解读国内外数据分类分级标准并结合实践案例分享，深入剖析了数据分类分级的核心内容与应用实践。希望本文能够为广大读者提供有益的参考和启示。

数据可视化的力量

140

数据可视化图表核心

大家好我随风，现在是周一早晨9点15分，会议室里坐满了人。你或者你的领导，必须在15分钟后开始的晨会上，基于上周的业务数据，快速讲清楚三件事：业绩怎么样？

麦哲思科技任甲林

麦哲思科技（北京）有限公司总经理敏捷性能合弄模型评估师认证的Scrum Master 认证的大规模敏捷顾问SPC CMMI高成熟度主任评估师 COSMIC MPC,IAC 成员，中国分部主席

471 篇文章

浏览 951.5K

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

查看方案

麦哲思科技任甲林的其他文章

《敏捷估计与规划》读书笔记

CH1-1 策划过程比计划书更重要。CH1-2 必须做计划，但是不必过度投入时间。CH1-3 对瀑布模型的不确定性锥：CH1-4 PMI认为的估算偏差率：初步估算，order of magnitude estimate, 误差范围+75%到-25%；预算估算，budgetary estimate, 误差范围+25%到-10%；确定性估算，definitive est...

我说CMMI2.0 之过程资产开发（PAD）

PAD, process assesses development 过程资产开发，也可以翻译为过程财富开发。过程资产指什么？与过程有关的组织级方针、过程描述、裁剪指南、检查单、模版、规程定义、培训材料以及项目组裁剪后的过程定义、经验教训、典型案例、计划等资料都是过程资产。要注意：组织级的过程资产库中包含了组织的过程定义。过程定义在哪里要求的？在II的SP2.2和PAD3.3！实践列表...

白话SCRUM 之四：燃尽图

Burn down chart翻译为燃尽图或燃烧图，很形象，是Scrum中展示项目进展的一个指示器。我一直认为用户故事、每日站立会议、燃尽图、sprint review、sprint retrospective真是越琢磨越有味道的好东西，也因此很喜欢scrum这种方法，这些实践简单有效、经典！燃尽图的样例如下：横坐标为工作日期，纵坐标估计剩余的工作量，每个点代表了在那一天估计剩

常见非功能性需求的描述案例

非功能性需求是需求的一个重要组成部分，它影响了系统的架构设计，需要开发人员重点关注。但是在工程实践中，往往客户不会提出非功能性需求，需求人员在描述需求时不知道如何描述，在国际的各种标准中，对非功能性需求有定义，但是比较抽象。因此我整理如下常见的非功能性需求的描述案例，供需求人员进行参考。1、性能需求描述案例：响应时间：在95％的情况下，一般时段响应时间不超过1.5秒，高峰时段不超过4秒。定位系统从

惊魂一刻

2008年5月10日星期六，惊魂的一天。下午5点时我给司机电话，让他5点45分到莫泰168酒店接我，送我去宝安机场，我是7点40分的航班，通常情况从龙华到宝安机场40分钟足够了。他以为是要6点48分到酒店，害得我重复了至少3遍，他才听清楚，我当时就有点火，不知道他怎么听的，我口音没有那么严重啊。我是第一次坐他的车去机场。 5点50分他到了酒店，上了车，他并没有按常规的路线走，而是

随机阅读

产品创新案例：从用户生态复杂度视角，感受2B与2C的不同

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询

数据中存在的假象

版权声明

还在用多套工具管项目？

联系我们

融实践库

微信公众号

微信视频号

社区微信群