企业必备:搭建大模型应用平台实操教程

news2025/2/4 17:59:47

最近AI智能体很火,AI智能体平台化产品肯定属于大公司的。但在一些场景下,尤其是对业务数据要求很高的公司,那就只能用私有大模型。不一定完全是为了对外提供服务,对内改造工作流也是需要的。所以

  1. 我感觉未来大部分企业都会搞一个自己的大模型。大模型 + RAG的方案会非常成熟。
  2. 很多企业都会通过AI agent的智能体来改造工作流,很多工作的效率会因此而大大提效。

这类开源的大模型应用平台有很多,例如dify,fastgpt,langchain等。这里我以dify为例。

一、下载开源模型管理应用:ollama

地址:https://ollama.com/ 这是一个专门管理开源大模型的工具,通过这个工具我们可以安装到市面上大多数开源大模型。同时,它还对大模型做了精简,让我们在使用时,对本地电脑的显存要求更小。

直接点击Download下载。下载后运行应用,直接下一步安装即可。备注:该工具默认安装在C盘,所以模型文件默认也是安装在C盘。

如果你是windows系统,想把模型文件放到其他盘,需要在环境变量里创建一个OLLAMA_MODELS,它的值就是填你想存放模型的路径。例如 D://ollama

下载完毕后,在终端:执行ollama run 开源大模型名称。这里大模型的名字,需要是全名。ollama支持的模型都在这里:https://ollama.com/library 可以根据自己的电脑配置来选择模型,目前谷歌新出的2B小模型,在某些能力上据说也达到了GPT3.5的水平,如果要下载gemma2B,你需要执行这个命令。ollama run gemma2:2b 一般来说,8G显存能勉强跑7B。24G显存能跑14B。

等待模型下载后,就可以在终端运行了。但是终端操作毕竟还有点麻烦。所以一般我们会部署一个网页来进行访问。这个选择有很多,我们可以用🏡 Home | Open WebUI 也可以用dify等支持调用ollama模型的各种agent的平台。ollama的常见命令如下:

ollama list 查看所有已安装的本地大模型。ollama pull 模型名称,更新模型。ollama rm 模型名称,删除模型。......

二、安装docker容器

docker是一个开源的应用引擎,它能够很好的管理我们安装的一些应用。避免多个应用之间环境冲突。

安装地址:https://www.docker.com/

直接安装之后,下一步即可。安装完之后,在终端输入:docker -v可查询是否安装成功。

使用docker有两个很大的好处:

  1. 减少环境配置的麻烦。
  2. 更好的应用程序隔离和资源管理。

缺点是,docker被墙之后,需要梯子才能下载。或者自行通过镜像解决。

三、安装开源项目dify

打开dify开源地址:https://github.com/langgenius/dify

只要4个命令:

git clone https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
docker compose up -d

这里安装可能会慢一点。安装完之后,可以在docker里看到所有程序都运行了。

dify运行后,我们可以使用第三方key来使用大模型,也可以添加本地大模型。包括我们刚刚配置的ollama下载的模型。

但是因为dify是在docker里安装的,属于在容器里,想要访问docker外面的程序,需要做一些配置。

配置地址参考这个网址,windows、mac、linux都有点不一样。https://docs.dify.ai/guides/model-configuration/ollama

像我的Mac,配置时候,调用地址用改成这个即可:http://host.docker.internal:11434, 所有配置如下图:

保存后,刷新一下网页。然后我们创建一个ChatBOT

我们先从最简单的聊天助手开始。比如售前、售后客服。

根据自己的需求,填入提示词、知识库等内容。最后选择自己的配置好的模型。点发布后就能对外使用了。

四、部署智能客服到微信

打开这个开源项目:https://github.com/hanfangyuan4396/dify-on-wechat 目前已经支持,企业微信和个人微信。

git clone https://github.com/hanfangyuan4396/dify-on-wechat

把代码下载到本地,

拷贝下来后,在docker文件夹下,找到docker-compose.yml文件。按照我下面框住的地方进行修改。

DIFY_API_BASE 本地部署,就按我截图写。API秘钥都按我下图路径获取。

保存后,直接运行docker命令即可。

cmd

cd dify-on-wechat/docker       # 进入docker目录
docker compose up -d           # 启动docker容器
docker logs -f dify-on-wechat  # 查看二维码并登录

运行成功后,在终端和docker容器里都会有一个微信二维码出来让你登录,用微信小号扫码登录后就能体验了。

今天分享的内容,对没有开发基础的同学会有点难。但其实很多开源项目难度也就这样。搞定一个项目,就搞定了大多数。祝大家都能顺利完成吧!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2190973.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软考系统分析师知识点二:经济管理

前言 今年报考了11月份的软考高级:系统分析师。 考试时间为:11月9日。 倒计时:35天。 目标:优先应试,其次学习,再次实践。 复习计划第一阶段:扫平基础知识点,仅抽取有用信息&am…

数字乡村综合解决方案

1. 项目背景与战略 《中共中央、国务院关于实施乡村振兴战略的意见》强调实施数字乡村战略的重要性,旨在通过信息技术和产品服务推动农业农村现代化,实现城乡数字鸿沟的弥合。 2. 数字乡村发展纲要 《数字乡村发展战略纲要》明确了全面建成数字乡村的…

颍川陈氏始祖陈寔逆势崛起的原由(二)有贵人相助

园子说颍川 陈寔崛起之初,有两个贵人发挥了关键作用。 第一个就是许县县令邓邵,如果不是他推荐青年陈寔去太学读书,陈寔可能一辈子就要待在许县县衙当小吏了。关于他的记载不详,光这一件事就让他名垂青史,帮助一个穷…

为Floorp浏览器添加搜索引擎及搜索栏相关设置. 2024-10-05

Floorp浏览器开源项目地址: https://github.com/floorp-Projects/floorp/ 1.第一步 为Floorp浏览器添加搜索栏 (1.工具栏空白处 次键选择 定制工具栏 (2. 把 搜索框 拖动至工具栏 2.添加搜索引擎 以添加 搜狗搜索 为例 (1.访问 搜索引擎网址 搜狗搜索引擎 - 上网从搜狗开始 (2…

【AIGC】ChatGPT提示词Prompt助力自媒体内容创作升级

博客主页: [小ᶻZ࿆] 本文专栏: AIGC | ChatGPT 文章目录 💯前言💯高效仿写专家级文章提示词使用方法 💯CSDN博主账号分析提示词使用方法 💯自媒体爆款文案优化助手提示词使用方法 💯小结 &#x1f4af…

王者农药更新版

一、启动文件配置 二、GPIO使用 2.1基本步骤 1.配置GPIO,所以RCC开启APB2时钟 2.GPIO初始化(结构体) 3.给GPIO引脚设置高/低电平(WriteBit) 2.2Led循环点亮(GPIO输出) 1.RCC开启APB2时钟。…

Transformer架构概述(二)

目录 1. Transformer架构概述 1.1 《Attention is All You Need》论文概述 1.2 Transformer的模块组成 1.3 Encoder 和 Decoder 的区别与联系 2. Transformer的并行计算效率相对于RNN的提升 2.1 RNN中的顺序处理问题 2.2 Transformer中的并行化优势 3. Self-Attention机…

Spring Boot框架下的大学生就业招聘平台

5系统详细实现 5.1 用户模块的实现 5.1.1 求职信息管理 大学生就业招聘系统的用户可以管理自己的求职信息,可以对自己的求职信息添加修改删除操作。具体界面的展示如图5.1所示。 图5.1 求职信息管理界面 5.1.2 首页 用户登录可以在首页看到招聘信息展示也一些求职…

setTimeout,setInterval ,requestAnimationFrame定时器

setTimeout,setInterval ,requestAnimationFrame定时器 定时器函数通常用于执行定时任务,也就是说你做了一个功能放在定时器函数里,它可以在特定的时间去执行你的指令,或者说隔多长时间(单位时间内—毫秒为…

为什么每个人都要学习项目管理?

在这个已然到来的超级个体时代,项目管理这项技能,不仅仅是项目经理才需要掌握的,而是每个想要独当一面之人的必备技能。 所谓的独当一面,就是从一个人做好自己的事,到带领一群人从头到尾把事做成。而学习项目管理&…

路由器的工作机制

在一个家庭或者一个公司中 路由器的作用主要有两个(①路由–决定了数据包从来源到目的地的路径 通过映射表决定 ②转送–通过路由器知道了映射表 就可以将数据包从路由器的输入端转移给合适的输出端) 我们可以画一张图来分析一下: 我们好好来解析一下这张图&#x…

Chromium 搜索引擎功能浅析c++

地址栏输入:chrome://settings/searchEngines 可以看到 有百度等数据源,那么如何调整其顺序呢,此数据又存储在哪里呢? 1、浏览器初始化搜索引擎数据来源在 components\search_engines\prepopulated_engines.json // Copyright …

el-pagination组件封装

组件使用 源代码&#xff1a; <script setup> import Pagination from /components/pagination/index.vue import {ref} from "vue";const pageNum ref(1) const pageSize ref(10) const total ref(120)function loadData() {// 加载数据 } </script>…

C++教程一口气讲完!(万字讲解)( ̄y▽ ̄)╭ Ohohoho... 下

C 常量 常量是固定值&#xff0c;在程序执行期间不会改变。这些固定的值&#xff0c;又叫做字面量。 常量可以是任何的基本数据类型&#xff0c;可分为整型数字、浮点数字、字符、字符串和布尔值。 常量就像是常规的变量&#xff0c;只不过常量的值在定义后不能进行修改。 …

【设计模式】软件设计原则——开闭原则里氏替换单一职责

开闭原则内容引出 开闭原则 定义&#xff1a;一个软件实体&#xff0c;类&#xff0c;函数&#xff0c;模块&#xff1b;对扩展开放&#xff0c;对修改关闭。用抽象构建框架&#xff0c;用实现扩展细节。可以提高软件的可复用性和可维护性。 开发新功能时&#xff0c;尽量不修…

Redis实现每日签到(大数据量)

PHP语言使用Redis NoSQL服务器二进制数据类型实现大数据情况下签到功能 目录 问题 解决方式 封装签到类 功能调用 总结 问题 实现用户每日签到功能不难&#xff0c;但随着用户量上升之后&#xff0c;不论是存储还是判断对数据量来说都很麻烦&#xff1b;假如每天有100万用…

pytorch 与 pytorch lightning, pytorch geometric 各个版本之间的关系

主要参考 官方的给出的意见&#xff1b; 1. pytorch 与 pytorch lightning 各个版本之间的关系 lightning 主要可以 适配多个版本的 torch; https://lightning.ai/docs/pytorch/latest/versioning.html#compatibility-matrix&#xff1b; 2. pytorch 与 pytorch geometric 各…

深度学习-----------------------------束搜索

目录 贪心搜索&#xff08;一般来说计算最快的&#xff09;穷举搜索&#xff08;一般来说是最好的&#xff0c;但可能算不动&#xff09;束搜索&#xff08;Beam Search&#xff09; 总结 贪心搜索&#xff08;一般来说计算最快的&#xff09; 在seq2seq中使用贪心搜索来预测序…

软考数据库部分 ---- (概念数据库模型,三级模式,两级映像,事物管理)

文章目录 一、概念数据库模型二、结构数据库模型三、三级模式四、两级映像五、关系模式基本术语六、关系模式七、关系的数学定义八、数据定义语言九、SQL访问控制十、视图十一、索引十二、关系模式十三、范式十四、数据库设计十五、事物管理&#xff08;ACID&#xff09;十六、…

基于SPI协议的Flash扇区擦除实验

当一块Flash芯片中的不同的扇区烧录了不同的程序&#xff0c;而我们只想擦除某个扇区的程序保留其他程序时&#xff0c;Flash的全擦除是不能满足要求的&#xff0c;这时候就需要扇区擦除来实现这一功能。扇区擦除可以对Flash芯片中的某一扇区进行擦除而不改变其他扇区中的存储数…