扫码阅读
手机扫码阅读

大数据能力提升项目|学生成果展系列之五

56 2024-07-03
摘要:清华大学大数据能力提升项目成果回顾

摘要:清华大学大数据能力提升项目成果回顾

清华大学为了培养具备大数据思维和应用创新能力的“π”型人才,启动了“大数据能力提升项目”。该项目由研究生院、大数据研究中心与多个相关院系共同设计,旨在通过多学科的融合,开发跨学科大数据课程体系,采用线上线下混合式教学方法。2023年,该项目在学生中获得了广泛认可,学生们将所学技能成功应用于专业学习和科研中,并展现了数据科学的魅力。

在2023年中国高校计算机大赛大数据挑战赛中,数学科学系的黄震宁同学以基于多源数据的IT系统故障发现为题目,取得了全国三等奖。比赛中,参赛者需要利用IT系统监控中的追踪、日志、指标等多种数据源,通过机器学习模型发现系统故障。黄震宁在初赛中利用时间戳差分和特征细化技术,复赛中则通过对数据进行探索性分析,调整特征工程策略,最终使用EDA、特征工程、OVR、LGBM、五折交叉验证和STACKING等方法构建模型,显著提升了故障发现的效果。

该项目的实施不仅提高了学生的大数据分析和创新应用能力,而且通过实际参与竞赛等活动,学生们得以将理论知识应用于解决实际问题。通过这种方式,他们不仅了解了数据科学的实用性,还锻炼了自己的创新能力和跨学科思考方式。

编辑:文婧
校对:杨学俊

想要了解更多,点击 查看原文