OpenAI API 几乎可以应用于任何任务。
包括内容或代码生成、摘要、对话、创意写作、图片生成、文本语音互转等。
关键概念
文本生成:提示,输入越精准,输出越精准。
获得更好结果的几种策略:
1.写出清晰的指令:
包含详细信息(不要让模型来猜测你的意思。不要有歧义。请提供任何重要的详细信息或上下文。)(谁是总统?世界上那么多,怎么回答? 详细: 谁是 2021 年的墨西哥总统,选举多久举行一次?)
要求模型采用角色(不同的角色 思考的角度不一样)
使用分隔符清楚地指示输入的不同部分(三引号、XML 标记、章节标题等分隔符可以帮助划分要区别对待的文本部分。)(任务越复杂,消除任务细节的歧义就越重要)
指定完成任务所需的步骤(第 1 步,做什么 ;第 2 步,做什么)
举例说明(比如以鲁迅的风格回答。甄嬛体风格)
指定所需的输出长度。(比如要求回复500字)
2.提供参考文本,以更少的捏造发明虚假答案
指示模型使用参考文本进行回答 (指示模型使用提供的信息来撰写其答案。)
指示模型使用参考文本中的引文进行回答(即注明来源,引用哪个资料或链接等)
3.将复杂的任务拆分为更简单的子任务。复杂任务往往比简单任务具有更高的错误率。(拆分后,用早期任务的输出用于构建后续任务的输入)
使用意向分类来识别与用户查询最相关的指令(根据客户查询的分类,可以向模型提供一组更具体的指令,以便其处理后续步骤。)
对于需要很长对话的对话应用程序,请总结或筛选上一个对话(在整个对话中在后台异步总结先前的对话)
分段总结长文档,递归构建完整摘要(为了总结一个很长的文档,比如一本书,我们可以使用一系列查询来总结文档的每个部分。章节摘要可以串联和汇总,从而产生摘要的摘要。此过程可以递归方式进行,直到对整个文档进行汇总。如果有必要使用有关前面部分的信息来理解后面的部分)
4.给模型“思考”的时间
策略:在匆忙得出结论之前,指示模型制定自己的解决方案 (通过提示模型首先生成自己的解决方案来让模型成功注意到这一点)(模型自己想的与你给的对照,模型在回答特定问题之前详细推理问题有时很重要)
策略:使用内心独白或一系列查询来隐藏模型的推理过程(通过一系列查询来实现,其中除最后一个查询外,所有查询的输出都对最终用户隐藏。)
策略:询问模型在之前的传递中是否遗漏了任何内容(通过提示模型进行后续查询来查找它在以前的传递中遗漏的任何摘录,从而获得更好的性能。)
5.使用外部工具
策略:使用基于嵌入的搜索实现高效的知识检索(如果用户询问有关特定电影的问题,则将有关电影的高质量信息(例如演员、导演等)添加到模型的输入中可能很有用。嵌入可用于实现高效的知识检索)
策略:使用代码执行来执行更准确的计算或调用外部 API(不能依赖语言模型自行准确地执行算术或长计算。如果需要,可以指示模型编写和运行代码,而不是进行自己的计算。特别是,可以指示模型将要运行的代码放入指定格式,例如三重反引号。生成输出后,可以提取并运行代码。最后,如有必要,可以将代码执行引擎(即 Python 解释器)的输出作为下一个查询的模型输入。) (调用外部 API 比如执行python脚本这个牛,可以与你的程序结合了,但不安全)
策略:授予模型对特定函数的访问权限
策略:系统地测试更改(如果判断模型给出的哪种答案更好?输出的评估可以由计算机、人类或混合完成。)
策略:参考黄金标准答案评估模型输出(假设已知问题的正确答案应参考一组特定的已知事实。然后,我们可以使用模型查询来计算答案中包含多少必需的事实。)
助理:可以访问工具,这些工具允许助手执行更复杂的任务,例如运行代码或从文件中检索信息、控制机械手臂等。
嵌入:嵌入可用于搜索、聚类分析、建议、异常检测、分类等。比如上传文档。
令 牌:有点像模型处理的最小元素或单元。
文本语音互转:可以理解几乎所有人类语言方言等转文本,可以把文本输出为几乎自然的人的语音。
图像生成:按文本或图像或文件,生成图像。
视觉:图片理解,懂图的意思。
无需编码也能试用API
C# 快速入门 文本生成
using Newtonsoft.Json;
using System.Text;
class Program
{
static readonly HttpClient client = new HttpClient();
static async Task Main()
{
try
{
// 设置 API 密钥
string apiKey = "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";
client.DefaultRequestHeaders.Add("Authorization", $"Bearer {apiKey}");
// 构建请求体
var requestData = new
{
model ="gpt-3.5-turbo-1106",
messages = new[] {
new { role = "system",content = "周树人与鲁迅是什么关系" },
},
temperature = 1,
max_tokens = 600
};
string json = JsonConvert.SerializeObject(requestData);
StringContent content = new StringContent(json, Encoding.UTF8, "application/json");
// 发送请求
HttpResponseMessage response = await client.PostAsync("https://api.openai.com//v1/chat/completions", content);
// 获取响应
string responseString = await response.Content.ReadAsStringAsync();
Console.WriteLine(responseString);
// 解析content
dynamic data= JsonConvert.DeserializeObject(responseString);
var choices=data.choices;
if (choices!=null)
{
foreach (var choice in choices)
{
var message = choice.message;
Console.WriteLine($"content: {message.content}");
}
}
}
catch (HttpRequestException e)
{
Console.WriteLine("\nException Caught!");
Console.WriteLine("Message :{0} ", e.Message);
}
}
}
助手 API 原理
它与文本生成有什么不同?可以理解为多钱程的文本生成,我可以一直连续问,而不用等他回复。
任务的状态
人工智能的重大里程碑事件及技术创新:
一旦技术传递到普通大众,就意味着新的时代浪潮来临,个人电脑,人人上网,个人手机,个人智能Copilot。
1950年,艾伦·图灵提出了著名的图灵测试,用于评估机器是否具有智能。
1956年,约翰·麦卡锡等人在达特茅斯会议上首次提出了人工智能这个术语。
1997年,IBM的深蓝下棋程序击败了世界冠军加里·卡斯帕罗夫,成为第一个在国际象棋比赛中战胜人类的计算机系统。
2011年,IBM的沃森问答系统在美国电视节目危险边缘上击败了两位冠军选手,展示了自然语言处理和知识表示的能力。
2016年,谷歌的AlphaGo围棋程序在五局对弈中以4:1的比分战胜了世界冠军李世石,证明了深度学习和强化学习的强大性能。
2020年,OpenAI的GPT-3语言模型在多个自然语言理解和生成的任务上达到了令人惊叹的水平,创造了大规模预训练和自监督学习的新纪录。