基于Azure OpenAI Service 的知识库搭建实验⼿册

news2024/12/23 16:04:27
1.概要
        介绍如何使⽤Azure OpenAI Service 的嵌⼊技术,创建知识库;以及创建必要的资源组和资源,包括 Form Recognizer 资源和
Azure 翻译器资源。在创建问答机器⼈服务时,需要使⽤已部署模型的 Azure OpenAI 资源、已存在的表格识别资源和翻译资
源。通过 Azure ⾃定义资源模板创建服务,填写相应的参数即可。参数包括在您的 Azure OpenAI 资源上部署的指令引擎、在
Azure OpenAI 资源上部署的⽂档嵌⼊引擎、在 Azure OpenAI 资源上部署的查询嵌⼊引擎、您的 Azure OpenAI 资源名称、您的
Azure OpenAI API 密钥、 Redis Stack URL Azure Blob 存储连接字符串等。
嵌⼊是⼀种特殊的数据表⽰格式,可由机器学习模型和算法轻松使⽤。 嵌⼊是⼀段⽂本的语义含义的信息密集表⽰。 每个嵌⼊
是浮点数的⼀个向量,向量空间中两个嵌⼊之间的距离与原始格式的两个输⼊之间的语义相似性相关。 例如,如果两个⽂本相
似,则它们的向量表⽰形式也应该相似。
2. 实验步骤
本节主要描述了如何部署知识库问答服务的相关步骤。
2.1 创建必要的资源组和资源
本节主要是准备动作,创建好最终搭建服务所需要的资源。
2.1.1 创建资源组
Azure OpenAI 服务⽬前部署在 Azure 美东、美国中南部、⻄欧三个数据中⼼。因此,为了让相关资源配合运⾏时取得最低的时
延,建议将资源组以及内含的资源也创建在这三个数据中⼼之中。本例选择在美东数据中⼼创建全部资源和资源组。
以下是在 Azure 美东数据中⼼ (East US) 创建资源组的步骤:
登陆 Azure 管理界⾯ https://portal.azure.com ,选择左侧导航栏中的 资源组 选项
点击 “+ 新建 按钮,在弹出的新建资源组窗⼝中输⼊相关信息,包括资源组名称、订阅、区域等,区域选择美国东部

 

单击 查看 + 创建 以预览并创建资源组
2.1.2 创建 Azure OpenAI 资源
Azure OpenAI 资源是该解决⽅案的核⼼,需要率先创建 Azure OpenAI 资源才能实现对 OpenAI ⼤模型的部署,在 Azure Portal
中创建 Azure OpenAI 资源的步骤如下:
在资源组内,单击 “+ 添加 按钮,在弹出的菜单中选择 “Marketplace” 选项
“Marketplace” ⻚⾯中,搜索 “OpenAI” 并选择 “Azure OpenAI” 服务

 

点击 创建 按钮,根据提⽰填写相关信息,包括名称、订阅、资源组、地区、定价层等,地区选择 East US

点击 查看 + 创建 以预览并创建 Azure OpenAI 资源
创建完成后,访问 https://oai.azure.com ⻚⾯

 

在⻚⾯上点击新建部署按钮,创建 text-davinci-003 部署和 text-embedding-ada-002 部署

 

 

两个部署创建完成后,即意味着 OpenAI 资源已经准备就绪。
2.1.3 创建 Form Recognizer 资源
Azure Form Recognizer 的作⽤是⽤于从⽂档中提取表格、键值对等结构化数据。在本实验中,我们将使⽤ Form Recognizer
别知识库中的⽂本数据。创建 Form Recognizer 资源的步骤如下:
在资源组内,单击 “+ 添加 按钮,在弹出的菜单中选择 “Marketplace” 选项
“Marketplace” ⻚⾯中,搜索 “Form Recognizer” 并选择 表单识别器 服务
点击 创建 按钮,根据提⽰填写相关信息,包括名称、订阅、资源组、地区等,地区选择 East US
点击 查看 + 创建 以预览并创建表单识别器资源
2.1.4 创建 Azure 翻译器资源
Azure 翻译器资源的作⽤是将⽂本翻译成不同的语⾔。在本实验中,我们将使⽤ Azure 翻译器将知识库中的⽂本翻译成多种语
⾔。创建 Azure 翻译器资源的步骤如下:
在资源组内,单击 “+ 添加 按钮,在弹出的菜单中选择 “Marketplace” 选项
“Marketplace” ⻚⾯中,搜索 “Azure 翻译器 并选择该服务

 

单击 创建 按钮,根据提⽰填写相关信息,包括名称、订阅、资源组、地区等,地区选择 East US

 

单击 查看 + 创建 以预览并创建 Azure 翻译器资源

 

2.2 创建知识库问答服务

此存储库使⽤ Azure OpenAI 服务从⽂档创建嵌⼊向量。 为了回答⽤户的问题,它检索最相关的⽂档,然后使⽤ GPT-3 提取问
题的匹配答案。
请注意,您需要:
拥有已部署模型的 Azure OpenAI 资源(例如 text-davinci-003 等指令模型和 text-embedding-ada-002 等嵌⼊模型)
拥有已存在的表格识别资源
拥有已存在的翻译资源
以下是通过 Azure ⾃定义资源模板创建服务的步骤:
Azure 管理界⾯中选择左侧导航栏中的 创建资源 选项
在弹出的 创建资源 窗⼝中输⼊ 模板部署 ,选择 模板部署 ( 使⽤⾃定义模板部署 )”

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/841055.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一键翻译,实现文件名简体中文转日语的便捷改名!

您是否曾经遇到过想要将文件名从简体中文翻译成日语,却苦于没有合适的工具?现在,让我们为您介绍一款便捷的解决方案——文件名简体中文转日语翻译工具! 首先,第一步,我们需要打开文件批量改名,…

无涯教程-Perl - binmode函数

描述 此函数设置在区分两者的操作系统上以二进制形式读取和写入FILEHANDLE的格式。非二进制文件的CR LF序列在输入时转换为LF,在LF时在输出时转换为CR LF。这对于使用两个字符分隔文本文件中的行的操作系统(MS-DOS)至关重要,但对使用单个字符的操作系统(Unix,Mac OS,QNX)没有影…

付款方式谈得好,订单跑不了

在与客户商讨付款方式时出现分歧,其实是非常常见的情况。 在这种情况下,我们需要紧握谈判的节奏,不可忽视任何细节,更不能让自己陷入混乱之中。 先看一个案例~ 客户发来邮件: Dear... Please find our attached f…

远程访问桌面软件 OpenText Exceed TurboX(ETX)如何提高企业生产力

远程访问桌面软件 OpenText Exceed TurboX(ETX)如何提高企业生产力 几乎所有规模和行业的企业,员工的工作方式、时间和地点方面发生重大变化,这主要得益于新技术和全球商业与协作。业务领导者正在推动其 IT 部门提出解决方案&…

使用yarn启动项目报错

使用yarn启动项目报错 解决方法: 1.点击“开始”菜单搜索找到 Windows PowerShell ISE并以管理员身份运行(注:不是以管理员的身份直接运行cmd) 2. 输入 set-ExecutionPolicy RemoteSigned 回车 3.输入(选择全是) 4.再输入get-Exe…

【Linux】五、进程

一、冯诺依曼体系结构 存储器:指的是内存; 输入设备:键盘、摄像头、话筒,磁盘,网卡; 输出设备:显示器、音响、磁盘、网卡; 中央处理器(CPU):运算器…

【架构】Java 系统架构演进的思考

文章目录 1 前言2 单体应用架构3 垂直应用架构4 分布式架构5 SOA 架构6 微服务云架构7 总结 1 前言 随着移动互联的发展,网站、H5、移动端的应用规模也不断扩大,不管是应用的数量还是质量都得到了指数级的提升。开发者的数量与日俱增,应用的…

Python实现GA遗传算法优化Catboost回归模型(CatBoostRegressor算法)项目实战

说明:这是一个机器学习实战项目(附带数据代码文档视频讲解),如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 遗传算法(Genetic Algorithm,GA)最早是由美国的 John holland于20世…

The ‘kotlin-android-extensions‘ Gradle plugin is no longer supported.

Android使用kotlin开发,运行报错 The kotlin-android-extensions Gradle plugin is no longer supported. Please use this migration guide (https://goo.gle/kotlin-android-extensions-deprecation) to start working with View Binding (https://developer.an…

FPGA优质开源项目 - UDP RGMII千兆以太网

本文介绍一个FPGA开源项目:UDP RGMII千兆以太网通信。该项目在我之前的工作中主要是用于FPGA和电脑端之间进行图像数据传输。本文简要介绍一下该项目的千兆以太网通信方案、以太网IP核的使用以及Vivado工程源代码结构。 Vivado 的 Tri Mode Ethernet MAC IP核需要付…

HTTP——九、基于HTTP的功能追加协议

HTTP 一、基于HTTP的协议二、消除HTTP瓶颈的SPDY1、HTTP的瓶颈Ajax 的解决方法Comet 的解决方法SPDY的目标 2、SPDY的设计与功能3、SPDY消除 Web 瓶颈了吗 三、使用浏览器进行全双工通信的WebSocket1、WebSocket 的设计与功能2、WebSocket协议 四、期盼已久的 HTTP/2.01、HTTP/…

antv/l7地图,鼠标滚动,页面正常滑动-- 我们忽略的deltaY

背景 在官网项目中,需要使用一个地图,展示产品的分布区域及数量。希望的交互是,鼠标放上标点,tooltip展示地点和数量等信息。鼠标滚动,则页面随着滚动。但是鼠标事件是被地图代理了的,鼠标滚动意味着地图的…

yum出现Could not retrieve mirrorlist解决方法

Loaded plugins: fastestmirror, security Loading mirror speeds from cached hostfile Could not retrieve mirrorlist http://mirrorlist.centos.org/?release6&archi386&repoos error was 14: PYCURL ERROR 6 - “Couldn’t resolve host ‘mirrorlist.centos.org…

revit建模理解

关于Revit族的理解 Revit 和族术语实心和空心形状几何图形类型 Revit 和族术语 图元 - Revit Architecture 项目中的任何内容。(斜体图元可在族编辑器中创建和编辑。) 模型图元 - 代表建筑的实际几何图形的内容。 主体图元 - 可以接收/支持其他模型图元…

Ansible环境搭建,CentOS 系列操作系统搭建Ansible集群环境

Ansible是一种自动化工具,基于Python写的,原理什么的就不过多再说了,详情参考:https://www.itwk.cc/post/403.html https://blog.csdn.net/qq_34185638/article/details/131079320?spm1001.2014.3001.5502 环境准备 HOSTNAMEIP…

apple pencil性价比高吗?比较好用的电容笔

从压力感、充电器、接口、以及价格上来看,这种平替电容笔都要比原装电容笔的要好得多。平替的电容笔只能给人一种倾斜的压感功能,但苹果的电容笔却是既拥有着倾斜压感功能,又拥有着重力的压感。另外,由于技术的不断发展&#xff0…

SpringBoot3---核心特性---2、Web开发III(模板引擎、国际化、错误处理)

星光下的赶路人star的个人主页 夏天就是吹拂着不可预期的风 文章目录 1、模板引擎1.1 Thymeleaf1.2 基础语法1.3 属性设置1.4 遍历1.5 判断1.6 属性优先级1.7 行内写法1.8 变量选择1.9 模板布局1.10 devtools 2、国家化3、错误处理3.1 默认机制3.2 自定义错误响应3.3 最佳实战 …

string类函数--深入浅出了解

目录 1.为什么学习string类1.1C语言中的字符串1.2OJ题中的优势 2.标准库中的string类3.string类的常用接口函数3.1string类对象的常见构造3.2string类对象的容量操作3.3string类对象的访问及遍历操作3.4string类的修改操作3.5string类的非成员函数 总结 1.为什么学习string类 …

【《深入浅出计算机网络》学习笔记】第1章 概述

内容来自b站湖科大教书匠《深入浅出计算机网络》视频和《深入浅出计算机网络》书籍 目录 1.1 信息时代的计算机网络 1.1.1 计算机网络的各类应用 1.1.2 计算机网络带来的负面问题 1.2 因特网概述 1.2.1 网络、互联网与因特网的区别与关系 1.2.1.1 网络 1.2.1.2 互联网 …

[LitCTF 2023]Http pro max plus

打开环境后提示说,只允许在本地访问,本地访问,还是想到了XFF字段 好家伙的,直接被嘲讽,还是了解太少了,都不知道还有没有其他方式可以控制ip地址信息 经过查看wp,得知一种新的方式 Client-IP …