AI本科毕业前的年度总结!从FPS游戏到AI大模型

模型 实习 AI LLM https
发布于 2025-07-31
580

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

扫码阅读
手机扫码阅读

文章主旨:

作者总结了自己2024年的学习、实习和成长经历,分享了在深度学习、大模型领域的探索与心得,同时展望未来的目标与方向。

关键要点:

  • 作者通过自学深度学习,从基础知识到实现GPT2模型,改变了对AI的态度,转向深入研究大模型。
  • 实习期间参与了大模型在数据标注任务中的应用研究,评估多家模型性能,并调研私有化部署。
  • 通过参与开源项目和竞赛,补充了机器学习系统领域的知识,提升了实践能力和技术深度。
  • 在学习过程中经历了焦虑与迷茫,但通过榜样激励与自我反思,逐步明确了科研与职业发展方向。
  • 展望未来,作者强调心性磨练、长期规划与持续输出的重要性,力求在技术与表达能力上双重提升。

内容结构:

  • 2024年学习与技术探索:

    作者在寒假期间开始接触深度学习,通过自学Andre Karpathy的课程,从基础算法到实现GPT2模型,对AI领域产生浓厚兴趣。

    同时建议学弟学妹从前端或后端开发入手,以弥补学校教育对实践能力培养的不足。

  • 实习与大模型应用研究:

    作者在实习期间主要研究大模型在数据标注任务中的应用,评估多家国产和国际模型性能,深入了解模型指令遵循与信息抽取能力。

    观察到国内大模型厂商价格战的影响,认为DeepSeek和阿里的Qwen系列表现出色,成为重点关注对象。

  • 知识恶补与科研发展:

    在实习期间边学边输出,参与Datawhale的开源项目,负责并发部分教程,补充了机器学习系统领域的知识。

    同时通过阅读榜样文章,逐步实现对流水算法、算子开发、Tokenizer差异等技术的学习与实践。

  • 个人成长与未来规划:

    大四开学后确诊ADHD,作者将其视为保持专注的优势,同时从短期硕士升学转为考虑PhD,并计划通过GAP实习或RA沉淀科研能力。

    强调以长远规划为目标,同时做好局部任务,保持表达能力与技术输出,追求持续成长。

文章总结:

本文充满作者的思考与探索,展现了其在技术学习、实践应用与个人成长中的努力与反思,适合对AI领域感兴趣的读者学习与借鉴。

Datawhale