在海量文档中找资料?5 步打造属于自己的搜索引擎

news2024/10/1 18:42:58

在海量的文件中寻找那个关键的会议记录,是否让你感到头疼?

想要快速回顾上个月的项目报告,却迷失了一小时都找不到?

找报价、找库存、找供应商,整天忙于各种找找找?

现在就来教大家如何做属于自己的搜索引擎,不用再为在一大堆文件中“埋头苦寻”了。

本文阅读难度:★★★☆☆ 

AI工具:扣子

扣子

前两期做的都是小白能操作的,这期的内容相对难度会高些,但我仍会以入门的方式来讲解。

但是我不可能写长篇大论,所以你要举一反三,多多琢磨。

基本概念说明

先说说一些基本概念:

  1. 什么是提示词指令?
    这是你设计机器人基本作用,你希望这个机器人帮你做什么事情,你需要给它设定一个角色,并告诉它要怎么做。比如你希望A是一个服务员,B是一个厨师等等。
  2. 什么是插件?
    插件就就像你的电视机,连接了WIFI这个“插件”之后,你就能看网络电视了。当用户与机器人对话时,自动会匹配你需要调用插件的场景。就比如,你打开腾讯视频APP,它就会自动连接WIFI了。
  3. 什么是知识库?
    知识库就是你的文档内容,当你上传了知识库之后,你可以要求它在特定的情况下搜索这些资料。就比如你让图书馆管理员帮你找某本书,他就会帮你找出来。

基本操作

扣子是字节旗下的产品,用于智能体开发,与通用大模型(如KIMI/ChatGPT等)不同的是,它能完全按照你的个性化需求来定制,并且不需要编程知识,能采用自然语言创作属于你的专用机器人。

先注册一个扣子账号,然后创建智能体,创建有两种方式,如图:

一种是自动创建,一种是手动创建。

1.自动创建

自动创建就点击下方的按钮,把你的需求告诉它就行:

这样它就帮我们做好了一个机器人:

点开这个机器人,我们进入到以下的界面:

界面为左、中、右排版格式,左手边是提示词指令,中间是参数配置,右侧是输出界面(也就是你可以与之对话的界面,也是最终的成品)。

在左侧中我们已经看到,提示词它已经帮我们生成好了。

这就是自动创建的魅力,如果不是因为还要投喂数据,这个智能体大致已经可以用了。

2.手动创建

手动创建有些许区别,多了一些个性化操作步骤,需要填写名称、介绍、LOGO等信息:

不过也很简单,图标也可以用AI生成。

工作空间选择个人。

完成后点“确认”,然后就进入控制台:

界面是完全一样的,唯一的不同是左侧没了提示词模板,但其实搞定这个也很简单,你像刚才自动创建时那样,输入你的需求,然后点优化,如下:

它就会弹出窗口,自动帮你生成提示词,如果不满意就点上方的“重试”就会再生成,若满意就点使用,然后就会与刚才“自动创建”时一模一样的界面,这里不再复述了。

一个示例

学会了如何创建coze智能体,接下来我用一个我做过的示例,来说明如何创建一个属于自己的搜索机器人。

这是我做的一个闲鱼运营问答机器人,是方便我学习闲鱼的学员使用的,这是演示地址:https://www.coze.cn/s/iBe4UpSr/

你可以去试一下。

当你问到文档中某个问题时,它能从原文中调出数据,还告诉你位于第几章第几节,并提供连接。接下来,我就来演示一下操作流程,非常简单。

以下是整个开发界面:

1.关于提示词

左侧是我设计好的提示词模板:

# 角色

你是一个专业的问答客服,能够准确地根据用户的问题,从知识库中提取相关内容进行回答。

## 技能

### 技能 1:回答用户问题

1. 当用户提出问题时,仔细分析问题的关键信息。

2. 回答时,优先使用知识库中的内容,如果知识库找不到,则调用百度搜索插件搜索答案并回答,以下是返回格式:

=====

文库中没有答案,以下资料从网上搜索:

<答案>

=====

3. 以清晰、简洁的语言回答用户问题。

4.你能按照文档里的格式进行回复,回答要有段落格式,不要挤在一起。

5.如果知识库中含有图片,你也会输出图片。

6.如果调用了知识库,则要在文末会告诉用户该回答位于第几章第几节:

=====

》该回答位于《闲鱼运营手册》章节:<章节>

7.每次回答后,文末都加上:

加入闲鱼合作共创学习,可加作者心易微信号:aixzxinyi8

=====

## 限制:

- 回答问题时要确保准确性和客观性。

- 非闲鱼运营的问题不要回答,告诉用户不回答不相关的问题。

这个提示词原先是由COZE自动生成的,然后我再按它的格式重新编写。

这里说明一下提示词设计的一些要点:

(1)它会优先从知识库中调取内容,如果知识库没有,再从线上搜索答案;

(2)要求它输出知识库中的图片;

(3)要求它以文字形式告知答案位于哪个章节;

(4)加上版明;

(5)限制非闲鱼运营问题不要回答。

这些提示词都是一边调试一边完成的,而不是一气呵成的。

2.配置

我们看下中间界面:

因为我在提示词中有要求当知识库找不到内容,所以需要放置插件引擎插件,我用了百度的,操作方法如下:

点击插件中的+号,就会弹出插件市场的窗口:

这里除了有百度还有其它的搜索引擎,你喜欢用哪个都可以,然后点击添加即可。

然后来到知识库的位置,可以选择的有文本、表格、照片等知识库格式,在本次示例中我们只需要文本,因此在文本的位置点击+号:

然后弹出窗口,点击右上角的创建知识库:

然后弹出如下界面:

你可以上传本地文档、飞书文档,也可以获取在线网页内容等功能,我们办公常用的是上传本地文档或飞书,这里以上传本地文档为例。进入下一步之后就上传你所需要作为搜索的文档,你也可以理解为你建立了你所属的数据库,可以上传多份文档,如下图:

上传完成后进入分段设置:

分段的原理是明确你段落的知识块,比如你的知识库结构是这样的:

1.市场分析

XXXXX正文

2.用户分析

XXXXX正文

……

那么这样在知识库里面就分成两段,当你搜有关市场的内容时,它就会调取《1.市场分析》的内容。

你可以让它自动分段,也可以手动,我的闲鱼手册一开始是让它自动分段的,但由于图片过多,造成段落难以机器识别,所以经常一章被分成多段,造成知识结构混乱,回答不准确。

在这种情况下就需要做手动分段:

我使用了自定义标识符,以===号作为段落分割,每段长度调至5000最高。

与此同时,我的文档也要做相应的段落修改,如图:

在每个你想要分割的段落中加上标识符===,这就是告诉它看到这个时就分割为一个知识段落。

点击“下一步”,就完成了:

等几分钟,它需要处理数据,完成后,你可以看到分割后的段落:

每一个色块就是一个段落。

如果还有其它内容,就点击“添加内容”,如果没有,就点击“添加到Bot”:

这里需要单独说明的是:添加后的知识库可以使用在其它的智能体上,不需要每次重复添加。当然,如果修改,所有的引用这个知识库的智能体也一样使用新的内容。

这样就完成了,回到了开发界面,可以看到我们的知识已经添加进去了,接着我们点击右上角的“自动调用”下拉按钮:

会弹出这个窗体:

其它的你可以不用理会,把显示来源打开,这样每次搜索时就会去调取来源。

往下拉可以看到对话体验部分的内容:

此处可设置也可不设置,不会有任何影响。

开场白是告诉使用者这个智能体的功能,预置问题是方便将常用问题列表起来,省去重复输入的操作,我们测试一下:

挺好的,点击右上角“发布”即可,大功告成!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2182928.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

分治法c++

分治法c 快速幂题目算法代码 大整数乘法题目思路代码 快速幂 题目 三个整数 a、b 和 m&#xff0c;计算 a 的 b 次幂对 m 取模的结果ab ac abc(ab)|m(a|mb|m)|m。|为数学中的求模运算符&#xff0c;相当于c语言中的%。(ab)|m(a|mb|m)|m 算法 二分法求幂。先求ab的一半&…

【算法竞赛】尺取法

尺取法(又称为双指针、Two Pointers)是算法竞赛中一个常)用的优化技巧,用来解决序列的区间问题,操作简单,容易编程。如果区间是单调的,也常常用二分法求解,所以很多问题用尺取法和二分法都行。另外,尺取法的操作过程和分治算法的步骤很相似,有时也用在分治中。 概念 什么是尺…

位运算(4)_丢失的数字

个人主页&#xff1a;C忠实粉丝 欢迎 点赞&#x1f44d; 收藏✨ 留言✉ 加关注&#x1f493;本文由 C忠实粉丝 原创 位运算(4)_丢失的数字 收录于专栏【经典算法练习】 本专栏旨在分享学习算法的一点学习笔记&#xff0c;欢迎大家在评论区交流讨论&#x1f48c; 目录 温馨提示:…

学习VTK的目的和方法

1 VTK&#xff08;Visualization Toolkit&#xff09;是一个开源的跨平台软件系统&#xff0c;用于三维计算机图形学、图像处理和可视化。学习VTK的主要目的有&#xff1a; 3D可视化&#xff1a; VTK提供了丰富的工具和算法&#xff0c;可以用来可视化各种科学数据&#xff0c…

VBA数据库解决方案第十五讲:Recordset集合中单个数据的精确处理

《VBA数据库解决方案》教程&#xff08;版权10090845&#xff09;是我推出的第二套教程&#xff0c;目前已经是第二版修订了。这套教程定位于中级&#xff0c;是学完字典后的另一个专题讲解。数据库是数据处理的利器&#xff0c;教程中详细介绍了利用ADO连接ACCDB和EXCEL的方法…

windows下安装nginx和基本配置

1. 下载 Nginx 从 Nginx 官方网站下载 Windows 版本的 Nginx。访问 Nginx 官网 并选择适合 Windows 的版本。通常应选择稳定版&#xff08;Stable version&#xff09; 2. 安装 Nginx 安装 Nginx 实际上是解压下载的文件。可以选择一个适合的位置来存放 Nginx 的文件夹 例如…

【数据结构初阶】排序算法(下)冒泡排序与归并排序

文章目录 4. 交换排序4. 1 冒泡排序 5. 归并排序6. 非比较排序6. 1 计数排序 5. 排序性能分析6. 排序算法复杂度及稳定度分析 4. 交换排序 交换排序基本思想: 所谓交换**&#xff0c;就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置**。 交换排序的特点是…

下一代性能怪兽RTX 5090最新规格更新与Blackwell架构解析

据悉&#xff0c;目前各家AIC厂商已经陆续收到NVIDIA的相关资料&#xff0c;RTX 5090、RTX 5080已经正式进入开案阶段&#xff0c;也就是厂商们开始设计各自的产品方案了。不出意外&#xff0c;年初的CES 2025上会看到RTX 5090/5080的发布。 作为NVIDIA的新一代GPU&#xff0c…

2024年健康经济与大数据研讨会(HEBD 2024)2024 Seminar on Health Economics and Big Data

在线投稿&#xff1a;学术会议-学术交流征稿-学术会议在线-艾思科蓝 2024年经济决策与人工智能国际学术会议 &#xff08;EDAI 2024&#xff09;将在2024年11月08-10日在广东省广州市隆重举行。大会邀请来自国内外高等院校、科学研究所、企事业单位的专家、教授、学者、工程师…

理解互联网链路:从本地ISP到Tier 1 ISP运营商

1. 互联网服务提供商&#xff08;ISP&#xff09; 互联网服务提供商&#xff08;ISP&#xff09;是指提供互联网接入服务的公司或组织。它们负责将用户连接到互联网&#xff0c;并提供相关的服务&#xff0c;如电子邮件、网站托管和其他在线服务。ISP可以分为不同的层级&#…

告别转换顾虑,来试试这四款pdf转换器~

各位小伙伴们&#xff0c;大家好&#xff01;今天我来给大家分享几款超级好用的PDF转换工具&#xff0c;无论是工作还是学习&#xff0c;相信这些工具都会给你带来极大的便利&#xff1b;别看PDF文件看似难搞&#xff0c;其实有了这些神器&#xff0c;一切都变得轻松又愉快&…

在线css像素Px到百分比(%)换算器

具体请前往&#xff1a;在线Px转百分比(%)工具--将绝对像素(px)长度单位转换为相对父级元素内尺寸的相对长度单位百分比(%)

PCL GridMinimum获取栅格最低点

目录 一、概述 1.1原理 1.2实现步骤 1.3应用场景 二、代码实现 2.1关键函数 2.1.1 GridMinimum 栅格最低点提取 2.1.2 可视化函数 2.2完整代码 三、实现效果 PCL点云算法汇总及实战案例汇总的目录地址链接&#xff1a; PCL点云算法与项目实战案例汇总&#xff08;长…

新农人的求索:既要种菜,也要种钱

澎湃新闻记者 何惠子 灯下立着一个玻璃瓶&#xff0c;内里空无一物&#xff0c;清晰透亮。 一只手握住瓶身。“就像这个瓶子。前途一片光明&#xff0c;但其实都在瓶子里。” 解晓巍说的是音乐——他曾梦想以此维生。事实上&#xff0c;这也适合描述农业。 在没有任何收入的202…

计算机网络:计算机网络概述 —— 初识计算机网络

文章目录 计算机网络组成部分网络架构协议与标准网络设备网络类型作用实际应用案例 计算机网络 计算机网络是指将多台计算机通过通信设备和通信链路连接起来&#xff0c;以实现数据和信息的交换和共享的技术和系统。它是现代信息社会的基础设施之一&#xff0c;也是互联网的基…

工业现场干扰问题及处理方法

目前&#xff0c;各种干扰在各类工业现场中均存在&#xff0c;所以仪表及控制系统的可靠性直接影响到现代化工业生产装置安全、稳定运行&#xff0c;系统的抗干扰能力是关系到整个系统可靠运行的关键。随着DCS、现场总线技术的应用&#xff0c;被控对象和被测信号往往分布在各个…

Ubuntu启动后第一次需要很久才能启动GTK应用问题

Ubuntu启动后第一次需要很久才能启动GTK应用问题 自从升级了 Ubuntu 之后&#xff0c;设备重启&#xff0c;发现打开 Terminal 、Nautilus 以及其他的GTK 应用都很慢&#xff0c;需要至少一分钟的时间启动。 刚开始也是拿着 journalctl 的异常日志去寻找答案&#xff0c;但是没…

cheese安卓版纯本地离线文字识别插件

目的 cheese自动化平台是一款可以模拟鼠标和键盘操作的自动化工具。它可以帮助用户自动完成一些重复的、繁琐的任务&#xff0c;节省大量人工操作的时间。可以采用Vscode、IDEA编写&#xff0c;支持Java、Python、nodejs、GO、Rust、Lua。cheese也包含图色功能&#xff0c;识别…

山东大学操作系统学习笔记:第3.1讲程序的结构-简单的程序

第3.1讲&#xff1a;程序的结构-简单的程序 可执行文件 & 程序的装入 .rwdata(读写数据段): 存放程序中的含初值常量。这些常量在程序运行可以修改。 零初始化数据段&#xff08;.zidata/.bss - Block Started by Symbol&#xff09;&#xff1a;存放程序中的不含初值&am…

《自控原理》最小相位系统

在复平面右半平面既没有零点&#xff0c;也没有极点的系统&#xff0c;称为最小相位系统&#xff0c;其余均为非最小相位系统。 从知乎看了一篇答案&#xff1a; https://www.zhihu.com/question/24163919 证明过程大概率比较难&#xff0c;我翻了两本自控的教材&#xff0c;…