8月22日,OpenAI官网发布最新公告:GPT-3.5 Turbo 的微调现已推出,GPT-4 的微调将于今年秋天推出。
此更新使开发人员能够自定义更适合其自身的模型,并大规模运行这些自定义模型。早期测试表明,GPT-3.5 Turbo 的微调版本在某些狭窄任务上可以匹配甚至超越基本 GPT-4 级别的功能。与我们所有的 API 一样,传入和传出微调 API 的数据归客户所有, OpenAI或任何其他组织不会使用该数据来训练其他模型。
微调用例
改进的可操纵性:微调允许企业使模型更好地遵循指令,例如使输出简洁或始终以给定语言进行响应。例如,开发人员可以使用微调来确保模型在提示使用德语时始终以德语进行响应。
可靠的输出格式:微调提高了模型一致的格式化响应的能力,这对于需要特定响应格式的应用程序(例如代码完成或编写 API 调用)来说是一个至关重要的方面。开发人员可以使用微调来更可靠地将用户提示转换为可在自己的系统中使用的高质量 JSON 片段。
自定义音调:微调是磨练模型输出质量感觉的好方法,例如其音调,因此它更适合企业品牌的声音。拥有知名品牌声音的企业可以对模型进行微调,使其与其基调更加一致。
微调步骤
步骤一:准备您的数据{
"messages": [
{ "role": "system", "content": "You are an assistant that occasionally misspells words" },
{ "role": "user", "content": "Tell me a story." },
{ "role": "assistant", "content": "One day a student went to schoool." }
]
}
步骤二:上传文件curl -https://api.openai.com/v1/files \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-F "purpose=fine-tune" \
-F "file=@path_to_your_file"
步骤3:创建微调作业curl https://api.openai.com/v1/fine_tuning/jobs \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"training_file": "TRAINING_FILE_ID",
"model": "gpt-3.5-turbo-0613",
}'一旦模型完成微调过程,它就可以立即在生产中使用,并且具有与底层模型相同的共享速率限制。
步骤4:使用微调模型curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "ft:gpt-3.5-turbo:org_id",
"messages": [
{
"role": "system",
"content": "You are an assistant that occasionally misspells words"
},
{
"role": "user",
"content": "Hello! What is fine-tuning?"
}
]
}'
关于定价
微调成本分为两部分:初始训练成本和使用成本:
- 培训:0.008 美元/1K 代币
- 使用输入:0.012 美元/1K 代币
- 使用输出:0.016 美元/1K 代币
例如,一个gpt-3.5-turbo包含 100,000 个代币的训练文件并训练 3 个 epoch 的微调作业的预期成本为 2.40 美元。感兴趣的小伙伴快去试试微调属于自己的大模型吧!