一文详解大语言模型的流行架构与训练技术

发布于 2024-10-26

1788

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：一文详解大语言模型的流行架构与训练技术

文章来源：

AI生成未来

扫码关注公众号

扫码阅读

手机扫码阅读

大型语言模型构建流程总结

本文全面介绍了大型语言模型（LLMs）的构建流程，包含模型架构选择、数据准备、标记化、模型构建、预训练、微调、对齐以及解码策略等关键步骤。

1. 主流的LLM架构

LLMs的架构主要包括编码器、解码器和编码器-解码器组合，基于Transformer架构。其中，编码器适合理解整体序列，解码器适合文本生成，编码器-解码器适合基于输入生成新句子的任务。

2. 数据清理

数据清理包括过滤和去重，对LLMs性能有重要影响。数据过滤旨在提升数据质量，包括去除噪声、处理离群值、平衡数据集等，而数据去重则是为了减少偏见并提升泛化能力。

3. 分词

分词是将文本转换成标记的过程，常用的分词器包括BytePairEncoding、WordPieceEncoding和SentencePieceEncoding，以增加词典覆盖率并处理OOV问题。

4. 位置嵌入

位置嵌入包括绝对位置嵌入（APE）、相对位置嵌入（RPE）、旋转位置嵌入（RoPE）和相对位置偏置，用以保留序列顺序信息和考虑元素间的相对位置。

5. 模型预训练

预训练通过自监督学习使LLMs获得基本语言理解能力。常见的预训练方法有自回归语言建模和遮蔽语言建模，以及专家混合（MoE）。

6. 微调和指令微调

微调和指令微调用于提升LLMs的性能和适应特定任务，其中指令微调通过指令提升模型的遵循能力，Self-Instruct方法通过自生成指令进行微调。

7. 对齐

AI对齐指引导AI系统符合人类目标和原则。除了指令微调，还有RLHF和RLAIF等方法帮助LLMs避免非预期行为，以及DPO和KTO策略提升模型对齐。

8. 解码策略

解码策略包括Greedy Search、Beam Search以及Top-K和Top-P采样，用于从预训练的LLMs中生成文本。

9. 费效比优化

费效比优化包括优化训练（如ZeRO和RWKV）、低秩适应（LoRA）、知识蒸馏和量化，旨在降低成本并提升性能。

本文是大语言模型教程系列的一部分，提供了LLMs工作方式的深入理解。

AI生成未来

查看原文：一文详解大语言模型的流行架构与训练技术

文章来源：

AI生成未来

扫码关注公众号

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

查看方案

AI生成未来的其他文章

腾讯放大招了！AniPortrait开源上线！音频驱动逼真人像动画合成！人人都是歌手！

点击下方卡片，关注“AI生成未来”>>后台回复“

视觉文本语音强强联合！南大&腾讯优图发布GPT-4o级别的实时视觉语音交互——VITA1.5

点击下方卡片，关注“AI生成未来” 后台回复“GAI”?

计算效率和性能双赢！南大联合中移动发布高效多模态大模型新范式—— p-MoD

点击下方卡片，关注“AI生成未来” 后台回复“GAI”?

生成一个好故事！StoryDiffusion:一致自注意力和语义运动预测器必不可少（南开&字节）

击下方卡片，关注“AI生成未来”>>后台回复“GAI

ECCV2024 | 小成本微调CLIP大模型！CLAP开源来袭：零样本和少样本训练有救了！

.点击下方卡片，关注“AI生成未来”>>后台回复?

随机阅读

没有摩擦的地方就有流动：无畏部落的四个支柱

08-17

关于Scrum Mastering ... 9件事可以尝试

08-17

敏捷规模化的思考-再谈spotify

07-13

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询

一文详解大语言模型的流行架构与训练技术

版权声明

大型语言模型构建流程总结

1. 主流的LLM架构

2. 数据清理

3. 分词

4. 位置嵌入

5. 模型预训练

6. 微调和指令微调

7. 对齐

8. 解码策略

9. 费效比优化

你为什么如此焦虑和恐惧！程序员和程序员的老板们？

还在用多套工具管项目？

联系我们

融实践库

微信公众号

微信视频号

社区微信群