使用dify+deepseek部署本地知识库

news2025/3/18 6:50:22

使用dify+deepseek部署本地知识库

  • 一、概述
  • 二、安装windows docker desktop
    • 1、确认系统的Hyper-v功能正常启用
    • 2、docker官网下载安装windows客户端
    • 3、安装完成后的界面如下所示
  • 三、下载安装ollama
  • 四、部署本地deepseek
  • 五、本地下载部署dify
    • 5.1 下载dify的安装包
    • 5.2 将dify解压到任意目录
    • 5.3 开始部署dify
    • 5.4 通过浏览器访问本地的dify
  • 六、设置dify使用的模型
    • 6.1 设置dify使用的模型
    • 6.2 安装模型厂商,设置对应的key
    • 6.3 设置系统推理模型
  • 七、创建本地知识库
    • 7.1 安装bge-m3模型
    • 7.2 在dify中添加bge-m3模型
    • 7.3 创建本地知识库
  • 八、创建对话助手

一、概述

随着AI工具的广泛使用,利用现有的AI工具(例如deepseek、豆包、kimi、GPT等)可以大副度地提升日常的工作效率。但对于企业来说,为考虑数据的安全性,可以考虑本地部署AI,避免数据泄露。同时通过搭建自己本地的知识库,实现定制化的功能。

二、安装windows docker desktop

1、确认系统的Hyper-v功能正常启用

控制面板 ——> 程序和功能
在这里插入图片描述

2、docker官网下载安装windows客户端

https://www.docker.com/
在这里插入图片描述等待安装包下载完成, 双击运行安装即可,所有选项保持默认

3、安装完成后的界面如下所示

首次安装时,默认是没有任何容器显示的,这是我部署好dify界面的截图
在这里插入图片描述

三、下载安装ollama

在这里插入图片描述在这里插入图片描述等待安装包下载完成, 双击运行安装,中间没有任何选项,保持下一步安装即可

四、部署本地deepseek

此案例中部署的是deepseek-r1:7b版本
在这里插入图片描述在这里插入图片描述

说明:运行上面的命令为部署deepseek-r1:7b版本,由于我这里事先已经部署好了,直接会进入模型。首次部署时,会出现下载过程,大约4.7G的容量,看网速等待完成即可

五、本地下载部署dify

5.1 下载dify的安装包

https://github.com/langgenius/dify
在这里插入图片描述等待安装包下载完成

5.2 将dify解压到任意目录

最好不要有中文
切换到解压目录的docker目录(D:\dify-main\docker)中,将.env.example复制重命名为.env

5.3 开始部署dify

在这里插入图片描述由于我这里dify事先部署完成了,所以显示的都是running过程。首次部署时,需要等待下载相应的容器镜像,创建相应的容器

成功部署后,可以在docker desktop界面查看创建的容器、及镜像
在这里插入图片描述在这里插入图片描述

5.4 通过浏览器访问本地的dify

按第一步的提示,创建管理员用户,跳转到登录界面
在这里插入图片描述登录成功后的界面如下所示

在这里插入图片描述

六、设置dify使用的模型

6.1 设置dify使用的模型

在这里插入图片描述

6.2 安装模型厂商,设置对应的key

比如这里设置ollama厂商调用本地部署的deepseek-r1:7b
在这里插入图片描述在这里插入图片描述

6.3 设置系统推理模型

在这里插入图片描述

七、创建本地知识库

7.1 安装bge-m3模型

在这里插入图片描述

7.2 在dify中添加bge-m3模型

在这里插入图片描述

7.3 创建本地知识库

在这里插入图片描述在这里插入图片描述

八、创建对话助手

创建对话助手,使用本地的知识库进行对话问答
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2317067.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【算法day13】最长公共前缀

最长公共前缀 https://leetcode.cn/problems/longest-common-prefix/submissions/612055945/ 编写一个函数来查找字符串数组中的最长公共前缀。 如果不存在公共前缀&#xff0c;返回空字符串 “”。 class Solution { public:string longestCommonPrefix(vector<string&g…

Java高频面试之集合-13

hello啊&#xff0c;各位观众姥爷们&#xff01;&#xff01;&#xff01;本baby今天来报道了&#xff01;哈哈哈哈哈嗝&#x1f436; 面试官&#xff1a;为什么 hash 函数能降哈希碰撞&#xff1f; 哈希函数通过以下核心机制有效降低碰撞概率&#xff0c;确保不同输入尽可能映…

RGV调度算法(三)--遗传算法

1、基于时间窗 https://wenku.baidu.com/view/470e9fd8b4360b4c2e3f5727a5e9856a57122693.html?_wkts_1741880736197&bdQuery%E7%8E%AF%E7%A9%BF%E8%B0%83%E5%BA%A6%E7%AE%97%E6%B3%95 2.2019年MathorCup高校数学建模挑战赛B题 2019-mathorcupB题-环形穿梭机调度模型&a…

YOLOv8轻量化改进——Coordinate Attention注意力机制

现在针对YOLOv8的架构改进越来越多&#xff0c;今天尝试引入了Coordinate Attention注意力机制以改进对小目标物体的检测效率。 yolov8的下载和安装参考我这篇博客&#xff1a; 基于SeaShips数据集的yolov8训练教程_seaships处理成yolov8-CSDN博客 首先我们可以去官网找到CA注…

基于SpringBoot+Vue的驾校预约管理系统+LW示例参考

1.项目介绍 系统角色&#xff1a;管理员、普通用户、教练功能模块&#xff1a;用户管理、管理员管理、教练管理、教练预约管理、车辆管理、车辆预约管理、论坛管理、基础数据管理等技术选型&#xff1a;SpringBoot&#xff0c;Vue等测试环境&#xff1a;idea2024&#xff0c;j…

ONNX:统一深度学习工作流的关键枢纽

引言 在深度学习领域&#xff0c;模型创建与部署的割裂曾是核心挑战。不同框架训练的模型难以在多样环境部署&#xff0c;而 ONNX&#xff08;Open Neural Network Exchange&#xff09;作为开放式神经网络交换格式&#xff0c;搭建起从模型创建到部署的统一桥梁&#xff0c;完…

蓝桥杯————23年省赛 ——————平方差

3.平方差 - 蓝桥云课 一开始看题我还没有意识到问题的严重性 我丢&#xff0c;我想 的是用两层循环来做&#xff0c;后来我试了一下最坏情况&#xff0c;也就是l1 r 1000000000 结果运行半天没运行出来&#xff0c;我就知道坏了&#xff0c;孩子们&#xff0c;要出事&#…

一、串行通信基础知识

一、串行通信基础知识 1.处理器与外部设备通信有两种方式 并行通信&#xff1a;数据的各个位用多条数据线同时传输。&#xff08;传输速度快&#xff0c;但占用引脚资源多。&#xff09; 串行通信&#xff1a;将数据分成一位一位的形式在一条数据线上逐个传输。&#xff08;线路…

自带多个接口,完全免费使用!

做自媒体的小伙伴们&#xff0c;是不是经常为语音转文字的事儿头疼&#xff1f; 今天给大家推荐一款超实用的语音转文字软件——AsrTools&#xff0c;它绝对是你的得力助手&#xff01; AsrTools 免费的语音转文字软件 这款软件特别贴心&#xff0c;完全免费&#xff0c;而且操…

Qt QML解决SVG图片显示模糊的问题

前言 在QML中直接使用SVG图片&#xff0c;使用Image控件加载资源&#xff0c;显示出来图片是模糊的&#xff0c;很影响使用体验。本文介绍重新绘制SVG图片&#xff0c;然后注册到QML中使用。 效果图&#xff1a; 左边是直接使用Image加载资源显示的效果 右边是重绘后的效果 …

【Linux我做主】基础命令完全指南上篇

Linux基础命令完全指南【上篇】 Linux基础命令完全指南github地址前言命令行操作的引入Linux文件系统树形结构的根文件系统绝对路径和相对路径适用场景Linux目录下的隐藏文件 基本指令目录和文件相关1. ls2. cd和pwdcdpwd 3. touch4. mkdir5. cp6. mv移动目录时覆盖写入的两种特…

Designing Dashboards with SAP Analytics Cloud

Designing Dashboards with SAP Analytics Cloud

项目实战系列:基于瑞萨RA6M5构建多节点OTA升级-系统设计<一>

项目背景 原嵌入式控制系统采用分布式模块化架构&#xff0c;由12个功能板卡&#xff08;通信控制、信号采集、驱动执行等&#xff09;组成。系统维护阶段存在以下痛点&#xff1a; 低效的本地烧录机制&#xff1a;各板卡固件升级需通过JTAG接口逐一手动连接JLINK仿真器&#x…

《AI大模型趣味实战》 No3:快速搭建一个漂亮的AI家庭网站-相册/时间线/日历/多用户/个性化配色/博客/聊天室/AI管家(下)

《AI大模型趣味实战》 No3&#xff1a;快速搭建一个漂亮的AI家庭网站-相册/时间线/日历/多用户/个性化配色/博客/聊天室/AI管家(下) 摘要 本文介绍了家庭网站V1.3版本的更新内容&#xff0c;主要聚焦于AI管家功能的优化与完善。V1.3版本对AI管家模块进行了全面升级&#xff0…

c++基础知识-图论进阶

一、拓扑排序 1、基础知识 1&#xff09;什么是拓扑排序 对一个有向无环图G进行拓扑排序&#xff0c;是将G中所有顶点排成一个线性序列&#xff0c;使得图中任意一对顶点u和v&#xff0c;若&#xff0c;则u在线性序列中出现在v之前。 2&#xff09;拓扑排序的操作方法 重复执行…

[Java实战]Spring Boot服务CPU 100%问题排查:从定位到解决

Spring Boot服务CPU 100%问题排查&#xff1a;从定位到解决 1. 引言 当Spring Boot服务出现CPU占用率100%时&#xff0c;系统性能会急剧下降&#xff0c;甚至导致服务不可用。本文将通过真实代码案例&#xff0c;详细讲解如何快速定位问题根源&#xff0c;并提供解决方案。无…

1.6 极限存在准则

1.夹逼定理&#xff08;迫敛定理&#xff09; 1.1 数列型 1.1.1 准则 1.2 函数型 2. 两个重要极限

大华SDK协议在智联视频超融合平台中的接入方法

一. 大华SDK协议详解 &#xff08;一&#xff09;、大华SDK协议概述 大华SDK&#xff08;Software Development Kit&#xff09;协议是大华股份为开发者提供的一套软件开发工具包&#xff0c;旨在帮助开发者快速集成大华设备&#xff08;如摄像头、NVR、DVR等&#xff09;的功…

卓越的用户体验需要智能内容

摘要&#xff1a;这篇文章指出静态文档已无法满足现代用户的需求&#xff0c;而智能内容则是构建卓越用户体验的关键。文章从智能内容的定义、优势和实际应用等方面进行了详细阐述&#xff0c;并强调了企业应积极拥抱智能内容&#xff0c;以提升客户满意度、降低成本并创造新的…