1 大模型的价值
LLM模型对人类的作用,就是一个百科全书级的助手。有多么地百科全书,则用参数的量来描述,
一般地,大模型的参数越多,则该模型越好。例如,GPT-3有1750亿个参数,GPT-4可能有超过1万亿个参数。
2 大模型的在OS上的表现形式
大模型包含一个参数文件(二进制文件)和一个代码文件。
3 大模型的主流架构
transformer架构是当前大模型的主流架构,transformer的左边是encoder、右边是decoder。但实际的大模型的架构是only decoder的transformer架构,也就是只有图的右边部分。
4 预训练、微调和强化学习对大模型的作用
完成预训练的大模型,属于文档完善型大模型,只能续写或改写用户的输入。这是基础形态。
文档完善型大模型经过了微调,可以变成生成型助手型大模型(有能力回答用户的问题)。这是进阶形态。
生成型助手型大模型对于有些问题回答得不好或产生幻觉,就可以通过人类反馈的强化学习来提升大模型的回答质量。这是高阶形态。