Prep流程节点之【清理步骤】
版权声明
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
大家好,我随风
上一个篇幅我们说了如何筛选字段,筛选字段有隐藏和移除之分,隐藏不会影响后去调用字段,但是也不会显示字段,筛选记录(筛选行)也有临时查看和删除行(筛选器)的分别,区别在于,临时查看不会被保存到节点中,也不会对流程产生任何影响,而排除记录则会对数据产生影响;
| 临时查看 |
在我们设计流程或者排查流程问题的时候,我们需要临时看一下某些条件下都包含了哪些数据,但是我们又不希望将其固定到流程当中,这时候我们就可以临时查看一下,在我们添加好清理步骤之后,在中,可以看到每个字段去重之后的内容,如果用过Excel切片器的同学应该比较熟悉,这和切片器差不多;
注意:这里的内容不是一一对应的关系,都是各自独立进行去重排序之后的结果,比如下图,这俩红框的内容实际上不是表格中的对应关系
我们如果需要查看对应关系,那么需要在数据窗口查看;
筛选记录我们在配置视图中进行操作,具体操作就是,鼠标点点点;我们之前说过,配置视图当中会将字段中的不重复数据罗列出来并排序,将日期和数字类型的字段内容以区间的方式展示,
在下图中点击任意一个条形即可实现筛选:
条形有蓝色和灰色,蓝色表示当前选中的数据在各个字段中的行数&行数占比,灰色表示当前数据在当前字段中的行数&行数占比,如下图,选中订单ID的null值,我们可以看到订单ID为NULL值的行在订单日期中具体分布在哪些日期当中;
我们当前把鼠标移至某个条形上,会看到:
当前查看的是哪些数据:2017/01/01-2018/01/01(左闭右开不包含2018/01/01)
这些数据的不重复值有多少行:308行
这些数据一共有多少行:2587(26%)行
这些数据中订单ID是NULL的有多少行:1(
在下方的数据预览窗口中我们可以看到订单ID为NULL的具体数据,如果感觉下边的数据预览窗口太小,我们可以在筛选的状态下切换到数据窗口查看;
我们会发现,我点击NULL但是在左侧的更改窗口中并没有生成筛选步骤,也就是说,我们点击的操作不会被记录到筛选器中,也就不会对后续流程产生影响;
如果我们想查看订单ID中包含-2015-的订单ID,我们只需要搜索 -2015-即可;
搜索模式有这么几种:包含(表示ID中任意位置是-2015-的数据)、开头为(表示以-2015-开头的数据)、结尾为(表示以-2015-结尾的数据)、精确匹配(表示数据是-2015-没有其他字符的数据)、不包含(表示任意位置都不包含-2015-的数据);这里需要注意,下边的只保留和排除是会记录到筛选器中生成更改步骤的,也就是说会对后续流程产生影响;
如果我们想选择同一个字段中的多个数据的话,可以按住Ctrl键点击需要的数据;
同一个字段中按住Ctrl选择数据,表示or,也就是订单ID等于选中的数据中的任意一个即可;
如果需要查看同时满足两个字段的条件的数据,那么我们可以按住Ctrl选择其他字段的数据,不同字段之间的的条件是and,也就是说,需要同时满足两个字段的选择条件才会显示;
我们再看日期和数字类型的字段,我们可以看到Prep默认给我们进行了摘要分组,以区间形式显示,这极大方便我们查看数据质量,但是有时候我们就需要看具体是哪个日期或者那个数字在字段中的行数,那么我们就可以将摘要更改为详细信息:
以上的操作在退出当前流程节点时都不会保存,只适用于当前流程节点的数据临时查看,如果需要记录操作,那么需要使用筛选器;
| 筛选器 |
其实筛选器和临时查看的操作步骤完全一致,只需要在选择完成之后,再选择一下只保留/排除;
点击只保留或者排除之后,我们就会在左侧的更改窗口中看到记录的步骤,同时配置窗格中的数据也就仅剩我们保留的数据,或者去掉了我们排除的数据;
如果需要修改筛选器的筛选条件,我们可以选择删掉步骤重新设置筛选器,也可以选择编辑筛选器;只需要在更改窗格中右键点击筛选器步骤,点击编辑按钮,即可跳转到编辑界面;
这里就是Prep自动生成的筛选器规则,如果我们需要修改,需要注意,表达式的结果必须是True或者False,也就是布尔值;具体语法规则我们放在创建计算字段的章节详细来说;这里大家只需要记住筛选器中的表达式是需要能够返回逻辑值的,能够返回逻辑值的可以有:IS类函数、逻辑表达式(>大于、=大于等于、)不等于)、逻辑运算符(AND与 OR或 NOT非);
如果我们不希望通过选择的方式生成筛选器,我们也可以直接点击筛选器值按钮,生成空筛选器,然后自己从0开始编写规则:
最后说一下,不管是只保留还是排除,都需要你对数据有了足够的了解之后才可以;话说回来,就算你对数据很了解,也建议每次运行前先查看一下数据质量,以免出现漏删或者多删除的情况出现;
???? 各位朋友们注意啦!
如果接到需求不知道怎么着手分析
如果你需要根据问题自己梳理需求但是无从下手
如果你也想从零开始补充一下数据分析思维
随风的数据分析
还在用多套工具管项目?
一个平台搞定产品、项目、质量与效能,告别整合之苦,实现全流程闭环。
白皮书上线