扫码阅读
手机扫码阅读

Power BI可视化 | 定点网抓操作示例

149 2024-06-06

在分析中国传统节日对商业产能的影响时,建立农历日期表是一项挑战。作者Helena介绍了如何使用Power BI Desktop的M函数和网页数据抓取功能来创建这样一个表。通过引入的“使用示例提取表”功能,用户可以输入数据样本,并让Power BI智能识别和抓取网页中具有相同样式的其他数据。这基于Web.BrowserContents和Html.Table两个函数;前者获取网页源码,后者根据CSS Selector返回数据表。

首先,需要使用M函数建立一个标准日期表。然后,通过浏览器搜索带有农历日期的日历网页,比如https://m.laohuangli.net。检查网页源代码,找到并复制所需农历信息的CSS Selector。

在Power BI中,选择从Web获取数据,并粘贴链接。使用“使用示例添加表”功能,输入所需信息关键词来提取当前页面的农历日期。随后,通过观察网址结构,并设置参数,将年份和年月日代入查询中,确保正确获取数据。

在Power BI中编辑URL分段,创建名为“获取农历”的函数。通过示例列功能,将日期ID列与农历日期信息进行匹配,创建所需的“年月日”列。确保输入格式与参数匹配以便自定义函数准确对应。

最后,调用自定义函数以匹配并获取网页中的农历日期信息,生成包含农历日期的完整日期表。此方法不仅限于获取农历日期,还可用于抓取节日日期、商品价格等多种网络信息。作者鼓励读者探索更多应用。

文章由PowerPivot工坊原创,也推荐了进一步学习Power BI的资源,并提供了联系方式以及二维码以关注更多相关内容。

想要了解更多,点击 查看原文