AI Studio星河社区生产力实践:基于文心一言快速搭建知识库问答

news2024/11/17 6:00:02

f17acd37269df30858d917f97e16911c.gif

还在寻找基于文心一言搭建本地知识库问答的方案吗?AI Studio星河社区带你实战演练(支持私有化部署)!

相信对于大语言模型(LLM)有所涉猎的朋友,对于“老网红”知识库问答不会陌生。自从大模型爆火后,开发者都希望尽快进行开发实战,企业都希望尽快在产品中集成LLM的能力,结合业务快速落地,那最直接的方式就是构建知识库问答。本项目由AI Studio星河社区开发者「SWHL」创作并发布体验应用,应用中使用AI Studio SDK(文末获取文档)提供的能力完成文心一言与向量检索增强的结合,与此同时,开发者「SWHL」提供的开源项目还支持本地私有化部署的版本,助力个人和企业完成知识问答系统搭建。

7801043938117eec7f065cf3527f1539.png项目亮点

1、除大语言模型接口需要单独部署外,其他部分均可使用CPU

2、整个项目模块化,不依赖lanchain库,各个部分都可以轻松替换,代码简单易懂

3、WebUI向量检索Log可视化

4、支持接入多个LLM模型

5、支持本地私有化部署

2c9a192091888073de5ff6df1b9e2c98.png应用体验Demo

41d0721cdfd1fdf3aff4a902f4f2e59b.gif

应用参数解读:

  • max_length:生成结果时的最大token数

  • top_p:用于控制模型生成文本时,选择下一个单词的概率分布的范围。具体来说,当使用top_p参数时,模型将考虑累积概率分布中概率之和最大的最小集合中的所有单词,并在其中选择下一个单词

  • temperature:用于调整模型生成文本时的创造性程度,较高的temperature将使模型更有可能生成新颖、独特的文本,而较低的温度则更有可能生成常见或常规的文本

  • Search Top_K:从文档向量数据库中召回的前K个相关内容,用于和问题拼接为完整内容送到大模型中,可选值有5,10, 15

354c9a96e60079f066175ec160f3d5e7.png工作流程

1、解析文档并存入数据库

e8d10a7877696ba0c9de61e29d6ad5bf.jpeg

2、检索并回答问题

bf4ce6b281a77e9b3a4d6895641d9d31.jpeg

61af747fa582c4943a87b07620b40cbf.png搭建知识库问答应用

Fork该项目

ac05de905a834140dc586300d5df7588.png

启动进入线上开发环境

选择CPU环境即可

139b5ddead65870fe9b68e3102decbc7.pngAI Studio星河社区每周均可免费获得一定数量算力

查看文件进行开发

2361c90f7e9531ca4c54216ce4a29fc1.png

e2a91b6513f962a0bd173fca38931ac0.png本地私有化部署

创作者已将该项目进行开源,有私有化部署需求的可移步至该项目Github,获取代码文件进行部署。

项目作者:SWHL,RapidAI开源组织成员,日常研究方向为大模型落地和CV相关,包括OCR和目标检测等方向。

  • 作者主页

https://github.com/SWHL

  • RapidAI开源组织主页

https://github.com/RapidAI

  • 该项目Github

https://github.com/RapidAI/Knowledge-QA-LLM

AI Studio星河社区已上线SDK开发工具,支持文心一言、Embedding等能力的高效使用,点击阅读原文查看SDK开发工具使用文档。

b4bd8a4fc52a5e655e98d55a163b415a.png

a518b13428f424d755e63dce8f8f97f4.jpeg

9a3f7d8114f8d0ac639c1480af940c72.png

b04cd330e7fbeb4692c61be8c6358811.jpeg

50f7efe6d7b226970d05ba553954d47b.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1012212.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

亚马逊封买家账号的原因有哪些

亚马逊可能封锁买家账号的原因有多种,主要是出于保护市场和维护平台秩序的考虑。以下是一些可能导致亚马逊封锁买家账号的常见原因: 1、涉及违规行为:如果买家违反了亚马逊的使用政策,如发表虚假评价、滥用退货政策、欺诈或盗窃等…

GitHub 执行定时任务之巴奴会员签到

经常忘记去点那么一下,人到中年记忆力衰退的厉害。所以… 前言 巴奴算是签到算是比较简单的那种,没有太多的限制,可能获取积分的大多是人都还是要去门店的吧,也没必要做太多的限制。 打开签到每日提醒后,自动推送的地…

软件测试工作的基本流程详解

软件测试报告 首先,作为测试人员需要学习并了解业务,分析需求点 为什么测试人员要参加需求分析?也就是进行测试需求分析的目的是什么? 第一、把用户需求转化为功能需求: 1、对测试范围进度量 2、对处理分支进行度量…

nature子刊|病毒与宿主微生物的“花式”互作!

期刊:nature microbiology 影响因子:28.3 发表时间:2023年5月 病毒是地球上最丰富多样的生命形式,存在于每一个环境中。深海中病毒与宿主的互作以及它们对生态系统的影响和功能尚不清楚。今天给大家来带…

使用Python CV2自动识别人脸并融合至新图片

需求说明 最近孩子很迷奥特曼,想尝试拿他的照片跟奥特曼合并下做个帅酷变身。我想一般的PS跟现在流行的AI工具应该都可以实现,但是咱是程序员可以尝试用Python来做一下嘛。 实现思路 Python图片处理离不开CV2库,这个实现思路很清晰。先根据…

【自学开发之旅】Flask-restful-Jinjia页面编写template-回顾(五)

restful是web编程里重要的概念 – 一种接口规范也是一种接口设计风格 设计接口: 要考虑:数据返回、接收数据的方式、url、方法 统一风格 rest–表现层状态转移 web–每一类数据–资源 资源通过http的动作来实现状态转移 GET、PUT、POST、DELETE path…

Tomcat修改配置文件

1.Tomcat启动乱码问题 1.1conf目录 说明:找到conf目录下logging.properties文件 1.2打开logging.properties文件 说明:将UTF-8修改成GBK 1.3.效果 2.端口冲突问题 2.1 conf目录 2.2打开 server.xml文件 2.3.修改端口 说明:port指的就是端…

自动化测试框架实战详解

前言 之前文章跟大家分享了一下自己在接口自动化测试中进行测试准备的一些相关知识点,接下来本篇文章详细分享一下接口自动化框架设计的思路总结,希望能对初次探索接口自动化测试的小伙伴们有一些思路上的帮助。 小编是以pythonrequestsunittestHTMLTes…

淘礼金红包检测,规避订单返款/转账资损问题的技术实现方案

先说业务场景:很多电商人在订单转账或返款时,可能会因订单使用了如首单礼金/新品礼金/优惠劵或其他红包类型,导致资金损失问题。如下图所示: 再说解决方案:具体规避这类订单红包的资损(返款/转账多返&#…

mount报错NTFS signature is missing

给nvidia AGX orin的开发板加了一个内存条 sudo fdisk -l sudo mount /dev/nvme0n1 /mnt/pan1 #将/dev/nvme0n1挂载到/mnt/pan1 下结果挂载时报错如下: NTFS signature is missing解决方法,给创建一个ntfs即可: sudo mkfs.ntfs /dev/nvme0n…

三勾商城(java+vue3)微信小程序商城+SAAS+前后端源码

项目介绍 本系统功能包括: 前台展示后台管理SAAS管理端,包括最基本的用户登录注册,下单, 购物车,购买,结算,订单查询,收货地址,后台商品管 理,订单管理&…

芯片设计流程

VLSI 代表超大规模集成(Very Large Scale Integration),这是一种通过将数百万个晶体管集成到单个芯片中来创建集成电路 (IC) 的技术。超大规模集成电路技术可以生产出紧凑、功能强大且低成本的微处理器、存储芯片、数字信号处理器和其他先进电…

DC系列靶机4通关教程

DC-4 信息收集 扫描主机 arp-scan -l端口扫描 nmap -p- -A 192.168.16.165发现ssh端口和80端口都打开着呢 目录扫描 dirsearch -u http://192.168.16.165dirb hhtp://192.168.16.165登录web网页 发现没有可用信息,发现页面提示admin 爆破 用户密码爆破 使用…

什么是AI数字员工?它能帮我们做什么?

在今年360智脑大模型应用发布会上,360集团创始人周鸿祎再度提到了AI数字员工,他认为AI数字员工将为企业带来一场工作效率革命。在当今数字化和自动化的时代,人工智能(AI)正在逐渐地融入到各行业,而AI数字员…

《优化接口设计的思路》系列:第二篇—接口用户上下文的设计与实现

系列文章导航 《优化接口设计的思路》系列:第一篇—接口参数的一些弯弯绕绕 《优化接口设计的思路》系列:第二篇—接口用户上下文的设计与实现 前言 大家好!我是sum墨,一个一线的底层码农,平时喜欢研究和思考一些技术…

财富潮涌:银行发展绿色经济创新路径

在《玩转金融新“绿”潮,银行纷纷亮大招》内容中,我们带大家了解了商业银行有关绿色信贷产品、绿色债券产品及绿色投资的内容。今天,我们将继续带大家了解商业银行绿色金融实践路径中关于绿色财富、绿色服务和绿色运营的分析。 在绿色金融实…

数字中国背景下,企业数字化转型需要“强IT”

随着科技的快速发展和全球商业环境的不断变化,中国企业对灵活性、创新性、全球化和效率的需求是迫切的,进行数字化转型来支撑企业的业务变革、组织优化已是业界共识。如何根据企业的实际情况进行数字化转型对企业管理层,特别是CIO提出了新的挑…

解决 Axios 跨域问题,轻松实现接口调用

跨域是指访问另外一个域的资源,由于浏览器的同源策略,默认情况下使用 XMLHttpRequest 和 Fetch 请求时是不允许跨域的。跨域的根本原因是浏览器的同源策略,这是由浏览器对 JavaScript 施加的安全限制。 Axios 跨域常见报错 跨域请求被阻止 (…

电子凭证试点深化后,企业如何应对?百望云提供电子凭证一体化解决方案!

今年5月,财政部、税务总局、人民银行、国务院国资委、国家档案局、标准委、国电联办、民航局、国铁集团九单位组织召开电子凭证会计标准深化试点启动会。 电子会计凭证的格式非常多样化,电子会计凭证的处理一直是企业的难点。此次试点工作虽然对企业的财…

SSL证书为什么要选付费?

SSL证书已经越来越多的使用在网站,小程序和APP上,对于保障网络安全,加密数据信息有至关重要的作用。随着SSL证书市场的发展,各种类型的证书产品也在不断丰富,用户在选择SSL证书时,除了可以购买付费证书&…