AI本科毕业前的年度总结!从FPS游戏到AI大模型
版权声明
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
Datawhale
扫码关注公众号
扫码阅读
手机扫码阅读
文章主旨:
作者总结了自己2024年的学习、实习和成长经历,分享了在深度学习、大模型领域的探索与心得,同时展望未来的目标与方向。
关键要点:
- 作者通过自学深度学习,从基础知识到实现GPT2模型,改变了对AI的态度,转向深入研究大模型。
- 实习期间参与了大模型在数据标注任务中的应用研究,评估多家模型性能,并调研私有化部署。
- 通过参与开源项目和竞赛,补充了机器学习系统领域的知识,提升了实践能力和技术深度。
- 在学习过程中经历了焦虑与迷茫,但通过榜样激励与自我反思,逐步明确了科研与职业发展方向。
- 展望未来,作者强调心性磨练、长期规划与持续输出的重要性,力求在技术与表达能力上双重提升。
内容结构:
- 2024年学习与技术探索:
作者在寒假期间开始接触深度学习,通过自学Andre Karpathy的课程,从基础算法到实现GPT2模型,对AI领域产生浓厚兴趣。
同时建议学弟学妹从前端或后端开发入手,以弥补学校教育对实践能力培养的不足。
- 实习与大模型应用研究:
作者在实习期间主要研究大模型在数据标注任务中的应用,评估多家国产和国际模型性能,深入了解模型指令遵循与信息抽取能力。
观察到国内大模型厂商价格战的影响,认为DeepSeek和阿里的Qwen系列表现出色,成为重点关注对象。
- 知识恶补与科研发展:
在实习期间边学边输出,参与Datawhale的开源项目,负责并发部分教程,补充了机器学习系统领域的知识。
同时通过阅读榜样文章,逐步实现对流水算法、算子开发、Tokenizer差异等技术的学习与实践。
- 个人成长与未来规划:
大四开学后确诊ADHD,作者将其视为保持专注的优势,同时从短期硕士升学转为考虑PhD,并计划通过GAP实习或RA沉淀科研能力。
强调以长远规划为目标,同时做好局部任务,保持表达能力与技术输出,追求持续成长。
文章总结:
本文充满作者的思考与探索,展现了其在技术学习、实践应用与个人成长中的努力与反思,适合对AI领域感兴趣的读者学习与借鉴。
Datawhale
Datawhale
扫码关注公众号
还在用多套工具管项目?
一个平台搞定产品、项目、质量与效能,告别整合之苦,实现全流程闭环。
查看方案
Datawhale的其他文章
加入社区微信群
与行业大咖零距离交流学习
PMO实践白皮书
白皮书上线
白皮书上线