关于语言模型私有化部署的讨论 | AIGC实践

news2024/10/7 6:40:52

上周在与TC同行关于AIGC实践的线上交流中,大家普遍比较关心的一个实践切入点是:语言模型的私有化部署——简单来说,就是在企业内部,部署一个属于自己的“ChatGPT”,对于本行业/专业知识,以及企业独有的产品和技术信息有充分的了解,并且提供用户接口,通过自然语言交流,解答内外部用户的问题。

其实,在此前/此后的多次单点交流中,也有不同行业的朋友向我咨询相同问题。可见,任何人在体验过ChatGPT超强的语言能力后,都不难意识到,这种交互方式必将会成为未来非常重要的应用场景。

这段时间,我花了不少时间做调研;并且,由于我司主营AI计算设备及软件,也刚好具备相关技术背景,于是便近水楼台地与研发Lead和产品经理分别进行交流,看看是否有机会率先实施并落地一个内部应用。

在此梳理一下相关脉络,做一个简单的分享,希望可以给到有相同问题的朋友一点启发。

8d996e2a32a905c8bcfaf2af35286388.png

主题图Prompt:Privatization Deployment of Large Language Models. technological style. --ar 16:9

基本分析

语言模型私有化部署的应用场景,可谓显而易见。

典型场景包括:

  • 内部知识库:提供企业内部的知识共享平台。

  • 智能客服机器人:提供获取产品/技术信息的用户接口。

  • 专家咨询机器人:提供医疗、律师等专业领域的咨询服务。

应用范围非常广泛,几乎可以涵盖所有专业咨询行业,以及所有对外输出产品和服务的企业。应用价值就更不必说了:

  • 技术革新,全面推进AI化进程。所谓的“第四次工业革命”,具有划时代意义;

  • 降本增效。既然AI可以又快又好地完成任务,自然也就不需要付出人工成本。

实现部署的相关资源包括:

  • 硬件:LLM对算力有比较高的要求。

  • 模型:可采用免费的开源模型。

  • 语料库:包括但不限于行业/专业信息;以及企业的产品/技术信息。

  • 算法:需要比较专业的算法工程师参与进行模型训练/微调。

研发观点

从研发的角度来看,实现语言模型私有化部署,还是非常有希望的。

实现语言模型私有化部署的系统架构,主要包括:

  • LLM:语言模型;

  • KB:知识库;

  • 框架:将LLM和KB建立联系;

  • UI:用户界面。

677a2d839091c71adb4bbfc2b880c697.png

其中,LLM可采用2种方式实现:

  • 使用公共模型:通过调用API接口使用OpenAI GPT-3.5

  • 使用开源模型:使用开源模型ChatGLM,但开源不能商用。参考:
    https://github.com/imClumsyPanda/langchain-ChatGLM

部署逻辑分别为:

18480b083cd1f94f92675739e618a26f.png

使用公共模型部署逻辑

220d7d669b88651203043abbcff65d53.png

使用开源模型部署逻辑

KB的输入是语料库,然后经过一系列处理,成为可被LLM调取的知识。

语料库的准备比较简单,只需要保证:内容是以TXT或者Markdown等格式存储的纯文本信息(不包含样式)。

也就是说,如果采用xml类型的内容系统,应该可以比较容易做系统集成;如果采用Word类型的文档,需要转换成不包含样式的纯文本信息,并做必要的数据清洗,避免在转换后出现异常。

产品观点

产品经理的意见,与研发Lead有很大不同,会比较偏向于相对悲观的观点。在他看来:

现有ChatGPT和文心一言采用的语言模型,具有巨大数量的权重参数,并且在语料库上投入了巨大的开发成本——这绝对是开源模型和数据集,无法比拟的。

即便如此,ChatGPT与文心一言在回答问题时,表现出的实际效果,也不完全令人满意;何况是企业基于开源模型自行开发的应用。

第三,语料库的开发也会牵扯到比较大的投入成本,切不说是行业内的专业信息,即便是聚焦在企业产品和技术上的信息,也可能需要投入非常大的工作量。

所以,投入成本与实现效果决定了,可能不太值得去做这样的尝试。

未来,企业比较有希望实现落地的方式是,当文心一言或其他类似应用,最终达到了一个比较好的输出效果后,可能会对外输出toB业务支持,当然,是需要付费的。对于普通企业而言,这可能是相对比较经济的方式。

总结

以上内容基于本人有限的眼界和理解,仅供参考。如果你的企业找到了低成本、高收益的解决方案,实施并落地了应用,也非常期待听到你的分享。

相关文章:#AIGC实践

其他推荐:

实施:GitHub + MarkDown 文档系统的工作环境部署及工作流程说明 | 技术传播

6290c8c4f928f3a4798bfcff3c2b4087.jpeg

技术传播是一片蓝海 | 技术传播

访谈:TC无处不在,只是我们没有发觉 | 技术传播

这次他们说好要“讲真的” | 传播

在座都别吵了,你们还有我 | 技术传播

一本培养强迫症患者的说明书 | 技术传播

就像用心做好日本料理 | 技术传播

顽固的老头子与无聊的说明书 | 技术传播

转战新媒体 | 技术传播

评测:王者荣耀的用户帮助系统 | 技术传播

让爸爸妈妈也能享受到科技发展带来的便利 | 技术传播

企业级信息管理系统初创方案构思 | 技术传播

 bd6df06476029b8951a90783f7942dd0.png

睿齐

技术传播从业者

品牌内容策划

自由摄影师

自由撰稿人

汪力迪

公众号:techcomm / htstory

微信号:bgrichi

邮箱:hash_0813@163.com

12bb80f9f2d4eeeaa0060b77a6434e2e.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/622214.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【学习日记2023.6.7】之 MyBatisPlus入门

文章目录 MybatisPlus1. 入门案例1.1 SpringBoot整合MyBatisPlus入门程序 2. MyBatisPlus概述2.1 MyBatis介绍2.2 MyBatisPlus特性 3. MyBatisPlus的CRUD操作4. MyBatisPlus分页功能5. 开启MyBatisPlus日志5.1 解决日志打印过多问题5.1.1 取消初始化spring日志打印5.1.2 取消Sp…

基于SpringBoot+Vue的学生考勤管理系统设计与实现

博主介绍: 大家好,我是一名在Java圈混迹十余年的程序员,精通Java编程语言,同时也熟练掌握微信小程序、Python和Android等技术,能够为大家提供全方位的技术支持和交流。 我擅长在JavaWeb、SSH、SSM、SpringBoot等框架下…

【Web服务器】基于Nginx搭建LNMP架构

文章目录 一、安装 MySQL 数据库1. 安装Mysql环境依赖包2. 创建运行用户3. 编译安装4. 修改mysql 配置文件5. 更改mysql安装目录和配置文件的属主属组6. 设置路径环境变量7. 初始化数据库8. 添加mysqld系统服务9. 修改mysql 的登录密码10. 授权远程登录 二、编译安装 nginx 服务…

2024」预备研究生mem-论据和结论为简单句(下)

一、论据和结论为简单句-建立联系 二、结论包含完成推理 改版: 三、课后题

盘点一个Python网络爬虫问题

点击上方“Python爬虫与数据挖掘”,进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 在天愿作比翼鸟,在地愿为连理枝。 大家好,我是皮皮。 一、前言 前几天在Python最强王者群【刘桓鸣】问了一个Python网络爬虫的问…

8自由度并联腿机器狗实现行走功能

1. 功能说明 本文示例将实现R309a样机8自由度并联腿机器狗行走的功能。 2. 并联仿生机器人结构设计 机器狗是一种典型的并联仿生四足机器人,其腿部结构主要模仿了四足哺乳动物的腿部结构,主要由腿部的节段和旋转关节组成。在设计机器狗的腿部结构时&…

实用教学Prompt 提示词实战:如何用 ChatGPT 指导高考语文作文写作

又是一年高考季,牵动着广大学生和家长的心。7 日上午,语文科目考试结束。 今年高考语文共7套试卷:全国甲卷、全国乙卷、新课标Ⅰ卷、新课标Ⅱ卷、北京卷、天津卷、上海卷。 以高考语文作文题目来实践检验一下,如何用合适的提问词&…

chatgpt赋能python:Python将首字母变成大写——提升SEO排名的一种简单方法

Python将首字母变成大写——提升SEO排名的一种简单方法 在SEO行业中,优化关键字密度和网站结构是常规且必要的工作。但是,除此之外,我们也应该注意到一些看似微不足道但可能对网站排名产生影响的细节。比如,对于文章标题和正文的…

Mocha AE:Track 模块

当对跟踪踪结果不是很满意的时候,可尝试更改下 Track(跟踪)模块中的选项之后重新跟踪。 Input 输入 Clip 剪辑 选择要跟踪的素材。 --Input 输入 --Layer Below 下方图层 Track Individual Fields 跟踪单个场 针对隔行扫描素材,…

【IMX6ULL驱动开发学习】01.安装交叉编译环境【附下载地址】

第一步(下载工具链): 从官网上下载交叉编译工具链 https://snapshots.linaro.org/gnu-toolchain/ 按照以下步骤选择 可以选择最新的(我也忘记我用的哪个版本了,都可以用问题不大) 第二步(…

【Rust日报】2023-06-06 motus 一个非常方便的命令行密码生成工具

motus 一个非常简单的命令行密码生成工具 Motus是一个命令行应用,帮你轻松生成安全密码。 它的用户界面非常简单、优雅,跟 1Password 的密码生成器一样,让你感觉很舒服。Motus 默认会把生成的密码复制到你的剪贴板,用起来非常方便…

2023智源大会议程公开丨AI生命科学论坛

6月9日,2023北京智源大会,将邀请AI领域的探索者、实践者、以及关心智能科学的每个人,共同拉开未来舞台的帷幕,你准备好了吗?与会知名嘉宾包括,图灵奖得主Yann LeCun、OpenAI创始人Sam Altman、图灵奖得主Ge…

java设计模式之:策略模式

文章目录 什么是策略模式?策略模式结构策略模式适用场景简单示例项目实战场景用一坨坨代码实现策略模式重构代码代码实现优惠券接口优惠券接口实现策略控制类测试类 总结 设计模式是软件设计中常见问题的典型解决方案。 它们就像能根据需求进行调整的预制蓝图&#…

基于BP神经网络对MNIST数据集检测识别(Pytorch,Tensorflow版本)

基于BP神经网络对MNIST数据集检测识别 1.作者介绍2.基于BP神经网络对MNIST数据集检测识别2.1 BP神经网络介绍2.2 神经元模型2.3 激活函数2.4 BP神经网络基础架构2.5 BP神经网络正向传播反向传播 3.基于BP神经网络对MNIST数据集检测识别实验3.…

Playwright系列:第14章 Playwright性能测试实战

下方查看历史精选文章 重磅发布 - 自动化框架基础指南pdfv1.1大数据测试过程、策略及挑战 测试框架原理,构建成功的基石 在自动化测试工作之前,你应该知道的10条建议 在自动化测试中,重要的不是工具 功能测试可以验证应用程序的功能是否正常,…

Cocos Store打通企业提现,诚邀更多团队和公司入驻!

2023年5月29日 Cocos Store 终于上线,令众多开发者期盼已久的功能——企业对公提现。 在此,真诚地对大家说一声:抱歉,我们来晚了! 但请一定相信 Cocos 引擎、Cocos Store 一直在努力并从未间断为开发者们创造价值&…

chatgpt赋能python:小黑框:Python程序员必备利器

小黑框:Python程序员必备利器 如果您是一名Python程序员,小黑框(Terminal)一定不陌生。小黑框是一种基于文本的用户界面,通常用于执行命令行任务,编写或调试代码等。Python程序员可以通过小黑框完成许多任…

【JUC基础】16. Fork Join

1、前言 “分而治之”一直是一个非常有效的处理大量数据的方法。著名的MapReduce也是采取了分而治之的思想。。简单地说,就是如果你要处理 1000 个数据,但是你并不具备处理 1000个数据的能力,那么你可以只处理其中的 10 个,然后分…

使用JSAPl来做一个倒计时的效果

今天的小案例需要做一个倒计时的效果 我们的时分秒需要一直进行倒计时&#xff0c;然后我们的页面颜色需要根据定时器的操作来进行更换&#xff0c;首先我们还是可以来分析一下我们的HTML步骤 <div class"countdown"><p class"next">今天是22…

HCIE-Cloud Computing LAB备考第二步:实战解题–第五题:论述二--跨数据中心部署问答--缩写法

跨数据中心部署 通常部署在同城或相近城市存在的两个数据中心&#xff0c;其物理距离在300km以内&#xff0c;两个数据中心均处于运行状态&#xff0c;可同时承担相同业务&#xff0c;提高数据中心的整体服务能力和系统资源利用率&#xff0c;当单数据中心故障时&#xff0c;业…