paper: 《Toolformer: Language Models Can Teach Themselves to Use Tools 》
核心思想,
1. Sampling API Calls :设计设计prompt,让模型生成含API调用的文本(如图3),只保留K个概率最高的API调用
2. Executing API Calls: 然后执行这些API,拿回结果,
3. Filtering API Calls: 把这些结果插入到原文,如果API调用的结果对于预测下一个token有利(不调用API和调用API,损失之差大于于一个阈值,则认为有利),那么就保留这条数据
4. Model Finetuning: 利用上述步骤构造出一个新的数据集,使用这个数据集(含API调用的文本),去做模型微调,让模型学会何时去生成API调用
5. Inference:解码步骤的时候,模型预测出API调用时,先去执行API,把API的结果拼接到文本中,然后继续解码。