自2018年以来,包含Google、OpenAI、Meta、百度、华为等公司和研究机构都纷纷发布了包括BERT, GPT等在内多种模型,并在几乎所有自然语言处理任务中都表现出色。
今天给大家推荐一本大模型方面的书籍<大规模语言模型:从理论到实践>
,本书将介绍大语言模型的基础理论包括语言模型、分布式模型训练以及强化学习,并以Deepspeed-Chat框架为例介绍实现大语言模型和类ChatGPT系统的实践。
书籍作者
章节内容
课件:
第一章 绪论
第二章 大语言模型基础
第三章 大语言模型预训练数据
第四章 分布式模型训练
第五章 有监督微调
第六章 强化学习
第七章 大语言模型应用
第八章 大语言模型评估
首先说,值得买,内容覆盖大规模语言模型的方方面面。我也买了,刚拿到手,过了一遍就给大家推荐一下。
目录