基于chatgpt-on-wechat搭建个人知识库微信群聊机器人

news2024/10/7 18:22:28

前言

啊,最近在别人微信群里看到一个聊天机器人,感觉挺好玩的。之前GPT刚出来的时候就知道有人把聊天机器人接入到微信或者QQ中来增加互动,但是当时没想那个想法。

很久没关注这块了,发现现在可以使用大模型+知识库的方式来打造自己的专属机器人。我突然眼前一亮,我现在特别需要这个机器人。

因为现在我的群里有以下几个问题:

  1. 会有很多新加入的群友,需要发送一些群规和欢迎语。
  2. 大家有时会问很多基础的重复性的问题。

我希望的

  1. 自动发送群规和欢迎语这个普通的群聊机器人都具备,这个不是刚需。
  2. 这个是我最希望解决的,因为很多小白问的问题都是一样的,那我有时候看消息不及时,来不及回复,或者一个答案重复发好几次。所以我希望能够将一些通用的问题规整到知识库里,再由群聊机器人来帮我从知识库中提取答案去回复。

于是迫不及待问下那个老哥,他说用的是chatgpt-on-wechat这个项目部署的。

OK开整,我开始在我的一个快要荒废的阿里云服务器上部署这个项目。

部署准备

  • 需要一台云服务器(或者你自己的电脑本地也可以,但是本篇只讲云服务器上部署的流程)
  • 服务器上安装宝塔面板

开始部署

项目地址:GitHub - zhayujie/chatgpt-on-wechat: 基于大模型搭建的聊天机器人,同时支持 微信公众号、企业微信应用、飞书、钉钉 等接入,可选择GPT3.5/GPT-4o/GPT4.0/ Claude/文心一言/讯飞星火/通义千问/ Gemini/GLM-4/Claude/Kimi/LinkAI,能处理文本、语音和图片,访问操作系统和互联网,支持基于自有知识库进行定制企业智能客服。

这里有两种方式:

  • docker部署的方式
  • python部署的方式

以上两种方式我都尝试了,最开始尝试的是docker,很不幸的是我docker没部署成功,应该是docker pull的问题,一直拉不下来镜像,无论是修改镜像加速还是修改docker pull加速都没成功。

无奈,只能用python的方式去部署。

拉取源码

将项目下载下来,压缩包传到宝塔上面

我直接上传到/www/wwwroot目录下

配置config文件

然后双击解压,解压完成后进入项目根目录找到config-template.json

这是一个配置模版,用来配置机器人的各项参数。我们需要复制这个文件,并命名为config.json

编辑配置文件,默认的是openai的配置,由于使用openai需要做个代理服务器,太麻烦,成本高(需要一台国外服务器)

于是先试试用LinkAI配置下

{
  "channel_type": "wx",
  "model": "moonshot-v1-8k",
  "moonshot_api_key": "sk-XXXX",
  "proxy": "",
  "hot_reload": false,
  "single_chat_prefix": [
    "bot",
    "@bot"
  ],
  "group_welcome_msg": "欢迎加入本群,欢迎语!!",
  "single_chat_reply_prefix": "[bot] ",
  "group_chat_prefix": [
    "@bot"
  ],
  "group_name_white_list": [
    "俺们俩的小群"
  ],
  "image_create_prefix": [
    "画"
  ],
  "speech_recognition": false,
  "group_speech_recognition": false,
  "voice_reply_voice": false,
  "conversation_max_tokens": 2500,
  "expires_in_seconds": 3600,
  "character_desc": "你是基于大语言模型的AI智能助手,旨在回答并解决人们的任何问题,并且可以使用多种语言与人交流。",
  "subscribe_msg": "感谢您的关注!\n这里是AI智能助手,可以自由对话。\n支持语音对话。\n支持图片输入。\n支持图片输出,画字开头的消息将按要求创作图片。\n支持tool、角色扮演和文字冒险等丰富的插件。\n输入{trigger_prefix}#help 查看详细指令。",
  "use_linkai": true,
  "linkai_api_key": "Link_XXXXX",
  "linkai_app_code": "EsurXXX"
}

其实想快速上手只用配置这几个参数即可,后面再慢慢开放其他额外的功能

model对话大模型(这里我填的是moonshot-v1-8k,就是月之暗面的大模型,如果想填别的,就填对应的大模型名称,比如:gpt-3.5-turbo)

moonshot_api_key大模型对话api_key,每个大模型的apikey格式不一样,比如月之暗面的是moonshot_api_key、gpt的是open_ai_api_key

group_name_white_list配置群名白名单,就是说你的机器人要在哪个群里使用,就填写那个群的群名。

use_linkai填写true

linkai_api_key填写你在linkAI上申请的apikey

linkai_app_code填写你在linkAI上的app code

具体配置说明参考

配置说明 | LinkAI - 一站式AI智能体平台 - 极简未来

注册LinkAI账号

然后需要去LinkAI注册账号

LinkAI - 一站式AI智能体平台 - 极简未来

创建一个应用

选择知识库应用,并且创建对应的知识库。

然后上传一些资料到知识库上

问答文档的格式是csv,下载csv模版

模版内容是一问一答的形式。

我增加了一些测试数据

然后来到你创建的应用这里检查绑定知识库

知识库设置,未命中策略我修改为了固定文案,防止AI自行推理出错误的信息。

宝塔创建项目

配置完成后,回到宝塔界面新建python项目

项目路径:填写你压缩包解压后的根目录

运行文件:app.py

项目端口:8080(记得去你服务器上安全组查看下是否开放8080端口)

python版本:3.9.7(建议3.9.x都可以,3.10.x可能会有问题)

框架:python

运行方式:python

安装依赖包:解压包根目录下的requirements.txt文件

然后点击提交,等待项目创建完毕。

创建好后可能是未启动或者启动的状态,这个时候将项目修改为未启动状态。因为还有些依赖没安装完毕。

然后点击终端

输入下面命令安装可选依赖

pip3 install -r requirements-optional.txt       # 可选依赖,语音、tool插件等功能需要

依赖安装完毕后启动会报错缺少tiktoken模块,输入下面命令安装下

pip install tiktoken

启动项目

然后输入下面命令

首次运行需要新建日志文件

touch nohup.out 

运行程序并通过日志输出二维码

nohup python3 app.py & tail -f nohup.out  

执行成功后可以看到二维码打印出来,拿你想要当机器人的微信号扫码登录就可以

扫码登录完成后,可以关闭终端界面,程序会在后台执行。

你会发现服务装填是未启动,这个不影响,程序已经执行了。

输出的日志在项目根目录的run.log文件内

如果你调试过程中需要关闭或者重启项目

输入查询命令

ps -ef | grep app.py | grep -v grep

关掉对应PID程序

kill -9 15230

比如这里程序的pid是20945,输入kill -9 20945关掉程序。

测试截图

可以看到回复我的信息是调取了知识库的。

一些问题

测试爽了,但是发现一些问题,LinkAI确实挺好用的,就是小贵!

这可不行,我又尝试了coze、FastGPT等其他几个类似的平台之后,找到了一个相对便宜点的,智谱AI.

智谱AI开放平台

因为一上来会送你3000万的tokens,美滋滋

同样的,智谱AI也是需要去申请APIkey和知识库的。

适配知识库

但是chatgpt-on-wechat项目目前不支持质谱AI的知识库

在github上找到了修改方法

新增支持 GLM-4 知识库检索功能 by xiexin12138 · Pull Request #1758 · zhayujie/chatgpt-on-wechat · GitHub

修改bot/zhipuai/zhipuai_bot.py

和config.py

修改完成后重启项目,扫码登录,成功运行。

模板参考

下面是我部署过程中尝试的一些config模板

月之暗面

{
  "channel_type": "wx",
  "model": "moonshot-v1-8k",
  "moonshot_api_key": "sk-XXXX",
  "proxy": "",
  "hot_reload": false,
  "single_chat_prefix": [
    "bot",
    "@bot"
  ],
  "group_welcome_msg": "欢迎加入本群,欢迎语!!",
  "single_chat_reply_prefix": "[bot] ",
  "group_chat_prefix": [
    "@bot"
  ],
  "group_name_white_list": [
    "俺们俩的小群"
  ],
  "image_create_prefix": [
    "画"
  ],
  "speech_recognition": false,
  "group_speech_recognition": false,
  "voice_reply_voice": false,
  "conversation_max_tokens": 2500,
  "expires_in_seconds": 3600,
  "character_desc": "你是基于大语言模型的AI智能助手,旨在回答并解决人们的任何问题,并且可以使用多种语言与人交流。",
  "subscribe_msg": "感谢您的关注!\n这里是AI智能助手,可以自由对话。\n支持语音对话。\n支持图片输入。\n支持图片输出,画字开头的消息将按要求创作图片。\n支持tool、角色扮演和文字冒险等丰富的插件。\n输入{trigger_prefix}#help 查看详细指令。",
  "use_linkai": true,
  "linkai_api_key": "Link_XXXXX",
  "linkai_app_code": "EsurXXX"
}

{
  "channel_type": "wx",
  "model": "glm-4",
  "zhipu_ai_api_key": "",
  "zhipu_ai_api_base": "https://open.bigmodel.cn/api/paas/v4",
  "zhipu_ai_knowledge_id": "",
  "proxy": "",
  "hot_reload": false,
  "single_chat_prefix": [
    "bot",
    "@bot"
  ],
  "group_welcome_msg": "欢迎加入本群,欢迎语!!",
  "single_chat_reply_prefix": "[bot] ",
  "group_chat_prefix": [
    "@bot"
  ],
  "group_name_white_list": [
    "俺们俩的小群"
  ],
  "image_create_prefix": [
    "画"
  ],
  "speech_recognition": false,
  "group_speech_recognition": false,
  "voice_reply_voice": false,
  "conversation_max_tokens": 2500,
  "expires_in_seconds": 3600,
  "character_desc": "你是基于大语言模型的AI智能助手,旨在回答并解决人们的任何问题,并且可以使用多种语言与人交流。",
  "subscribe_msg": "感谢您的关注!\n这里是AI智能助手,可以自由对话。\n支持语音对话。\n支持图片输入。\n支持图片输出,画字开头的消息将按要求创作图片。\n支持tool、角色扮演和文字冒险等丰富的插件。\n输入{trigger_prefix}#help 查看详细指令。",
  "use_linkai": false,
  "linkai_api_key": "Link_XXXXXX",
  "linkai_app_code": "XXXXXX"
}

总结下就是,部署了这个项目后确实能给我省不少精力,后续我只需要将一些常见问题汇总,构建成知识库的形式,方便群友去查询。

关于平台,LinkAI挺方便的,可以直接选择GPT4、Kimi等主流大模型,就是有点贵。个人感觉GLM4的知识库回答没有LinkAI的那么灵活,可能是我还没调好。

官方文档参考

快速开始 | LinkAI - 一站式AI智能体平台 - 极简未来

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1849394.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微服务改造启动多个 SpringBoot 的陷阱与解决方案

在系统运行了一段时间后,业务量上升后,生产上发现java应用内存占用过高,服务器总共64G,发现每个SpringBoot占用近12G的内存,我们项目采用微服务架构,有多个springboot应用。 一下子内存就不够用了&#xf…

MYSQL 四、mysql进阶 2(mysql逻辑架构以及查询流程)

一、mysql的逻辑架构 1. 逻辑架构剖析 1.1 服务器处理客户端请求 mysql是典型的c/s架构,即 client/server 架构,不论是客户端进程和服务器进程是采用哪种方式进行通信,最后实现的效果都是:客户端进程向服务器进程发送一段文本&am…

【D3.js in Action 3 精译】关于本书

文章目录 本书读者本书结构与路线图本书代码liveBook 在线论坛 D3.js 项目的传统开发步骤 本书读者 这本书适用于所有渴望在数据可视化工作中获得完全创意自由的人,从定制化的经典图表到创建独特的数据可视化布局,涵盖内容广泛,应有尽有。您…

RabbitMQ —— 理解及应用场景

一、MQ相关的概念 RabbitMQ 是一种分布式消息中间件,消息中间件也称消息队列MQ,那么什么是MQ呢?请继续阅读下文。 1.1、MQ的基本概念 什么是MQ MQ(message queue),从字面意思上看就个 FIFO 先入先出的队列,只不过队列…

基于SpringBoot+Vue在线考试报名系统设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍:✌全网粉丝10W,CSDN作者、博客专家、全栈领域优质创作者,博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码数据库🌟 感兴趣的可以先收藏起来,…

看到vue3源码中的__tests__文件中有很多xxx.spec.ts文件,这些文件是干什么的

问: computed.spec.ts这是什么文件 回答: computed.spec.ts 是一个文件命名的示例,通常用于编写和运行针对计算机软件中"computed"模块的测试。在这种情况下,.ts 扩展名表明这是一个 TypeScript 文件,通常用于编写 Angular 或者…

计算机组成原理 —— 存储系统(概述)

计算机组成原理 —— 存储系统(概述) 存储系统按层次划分按照存储介质分类按照存储方式分类按照信息可更改性分类根据信息的可保存性分类存储器性能指标 我们今天来学习计算机组成原理中的存储系统: 存储系统 存储系统是计算机系统中用于存…

【报错解决】引入@ComponentScan注解注册bean容器后,导致的接口404问题

引入ComponentScan注解注册bean容器后,导致的接口404问题 背景 由于微服务开发中,经常需要在公共模块在引入一些公共模块,供其他服务使用,但是其他服务需要在启动类中配置ComponentScan注解扫描这个公共模块下注册的 bean&#…

sixLabors.ImageSharp图片截取

一、nuget <PackageReference Include"SixLabors.ImageSharp" Version"3.1.4" /> 二、代码 using Microsoft.AspNetCore.Mvc; using Microsoft.Extensions.Logging; using System; using System.Collections.Generic; using System.Diagnostics; u…

Leetcode 剑指 Offer II 083.全排列

题目难度: 中等 原题链接 今天继续更新 Leetcode 的剑指 Offer&#xff08;专项突击版&#xff09;系列, 大家在公众号 算法精选 里回复 剑指offer2 就能看到该系列当前连载的所有文章了, 记得关注哦~ 题目描述 给定一个不含重复数字的整数数组 nums &#xff0c;返回其 所有可…

轻量级日志系统——Loki

目录 一、loki简介 二、Loki 快速上手 第一步安装 Loki 第二步安装 Promtail 第三步安装granafa 三、LogQL 语法 四、Loki收集nginx日志 1、修改nginx配置 2、nginx服务器上安装promtail 3、添加doshbarod 一、loki简介 Loki是 Grafana Labs 团队最新的开源项目&am…

【图解IO与Netty系列】Netty源码解析——事件循环

Netty源码解析——事件循环 Netty事件循环源码解析select()processSelectedKeys()NioMessageUnsafe#read()NioByteUnsafe#read() runAllTasks() Netty事件循环 当Netty服务端启动起来以后&#xff0c;就可以接受客户端发送的请求&#xff0c;接收到客户端发来的请求后就会有事…

大数据学习-大数据介绍

意义 从海量的数据中分析出海量数据背后的价值 需要分析海量的数据&#xff0c;就需要存储、计算和分析 那就需要分布式多台计算机合适的工具来处理数据 工具 特点 大数据的核心工作&#xff1a;从海量的、高增长的、多类别的、信息密度低的数据中挖掘出高质量的结果 数据存储…

RedHat9 | Web服务配置与管理(Apache)

一、实验环境 1、Apache服务介绍 Apache服务&#xff0c;也称为Apache HTTP Server&#xff0c;是一个功能强大且广泛使用的Web服务器软件。 起源和背景 Apache起源于NCSA httpd服务器&#xff0c;经过多次修改和发展&#xff0c;逐渐成为世界上最流行的Web服务器软件之一。…

C++ STL ③

sort排序 #include <iostream> #include <algorithm> using namespace std;int main() {int a[5],i;cout<<"请输入数组元素:"<<endl;for(i0;i<5;i){cin>>a[i];}sort(a,a5,greater<int>());for(i0;i<5;i){cout<<a[i…

系统架构师考点--数据库系统

大家好。今天我来总结一下数据库系统的相关考点。本考点一般情况下上午场考试占3-5分&#xff0c;下午场案例分析题也会出现。 一、数据库系统 数据&#xff1a;数据库中存储的基本对象&#xff0c;是描述事物的符号记录。数据的种类:文本、图形、图像、音频、视频、学生的档…

基于Redis和openresty实现高并发缓存架构

目录 概述缓存架构设计实践代码路由业务封装redis 效果 概述 本文是对项目中 QPS 高并发相关问题的一种解决方案&#xff0c;利用 Nginx 与 Redis 的高并发、超低延迟响应&#xff0c;结合 Canal 进行实现。 openrestry官网 当程序需要提供较高的并发访问时&#xff0c;往往需…

状态压缩DP——AcWing 291. 蒙德里安的梦想

状态压缩DP 定义 状态压缩DP是一种利用二进制数来表示状态的动态规划算法。它通过将状态压缩成一个整数&#xff0c;从而减少状态数量&#xff0c;提高算法效率。 运用情况 状态压缩DP通常用于解决具有状态转移和最优解性质的问题&#xff0c;例如组合优化、图论、游戏等问…

UDS服务——TransferData (0x36)

诊断协议那些事儿 诊断协议那些事儿专栏系列文章,本文介绍TransferData (0x36)—— 数据传输,用于下载/上传数据时用的,数据的传输方向由不同的服务控制:0x34服务表示下载,0x35服务表示上传。通过阅读本文,希望能对你有所帮助。 文章目录 诊断协议那些事儿传输数据服务…

Redis-事务-watch-unwatch

文章目录 1、监视key2、提交事务 1、监视key 打开两个窗口&#xff0c;第一个窗口先监视key&#xff0c;然后开始事务&#xff0c;然后再打开第二个窗口&#xff0c;修改balance为0 2、提交事务 此时事务被打断