社区版Dify + Ollama + DeepSeek-R1（14b）实现私有化LLM推理

社区版Dify + Ollama + DeepSeek-R1（14b）实现私有化LLM推理

news2025/4/1 15:47:45

社区版Dify + Ollama + DeepSeek-R1 （14b）实现私有化LLM推理

一、LLM推理模型简介
- 为什么要用推理模型？
- DeepSeek R1简介
二、具体实现过程
三、Dify 安装和专栏的以往文章推荐

在这里插入图片描述

一、LLM推理模型简介

为什么要用推理模型？

大模型本身就具备推理能力，为什么还需要推理模型，深度思考？
简单地说，就是推理能力相对较低，只能处理相对简单的问题，而不会深入思考更加复杂的问题，所以 OpenAI 发布了o1 ，可以做各种考试的题目。但是 o1 并不开源，价格看起来遥不可及。
值此，一个国内不怎么出名的公司，DeepSeek ，发布了V3，用一种低成本实现的高水准的LLM。（557万美元训练出671B的模型）开源免费可商用噢，随后不久就发布了一个初代的推理模型：DeepSeek-R1 和DeepSeek-R1-Zero。

DeepSeek R1简介

DeepSeek R1 论文中说到，他们摒弃了SFT，通过大规模的强化学习来激励推理，得到了和openAI o1 不相上下的效果，这是初代的推理模型，他们开源了，并且由千问和llama 模型来蒸馏出了不同的型号（1.5b，7b，8b，8b，14b，32b，32b，70b），供大家推理使用！
在这里插入图片描述

各个模型推理能力测评

图像来源：《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》

二、具体实现过程

如果部署了Dify和Ollama 其实很简单了。如果没有请看已成功安装Dify教程
然后安装Ollama 教程看篇3. 本地ollama搭建。
记得启动：

ollama serve

安装好Ollama之后，到ollama-deepseek-r1 仓库复制你要的模型命令：

ollama run deepseek-r1:14b

随即查看是否可以给调用：

http://your_ip_addr:11434/api/tags

在这里插入图片描述

然后继续，按照这里的教程：

最后，dify 搭建工作流发布即可：

三、Dify 安装和专栏的以往文章推荐

Dify安装时会遇到的网络问题，已成功安装Dify教程
Dify 部署LLM 可以参考这里，Dify实现Ollama3.2-vision多模态聊天
社区版Dify +ComfyUI 实现 Flux 文生图
并且欢迎关注我的社区版 Dify 开发专栏

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2283064.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【开源免费】基于Vue和SpringBoot的常规应急物资管理系统（附论文）

【开源免费】基于Vue和SpringBoot的常规应急物资管理系统（附论文）

本文项目编号 T 159 ，文末自助获取源码 \color{red}{T159，文末自助获取源码} T159，文末自助获取源码目录一、系统介绍二、数据库设计三、配套教程3.1 启动教程3.2 讲解视频3.3 二次开发教程四、功能截图五、文案资料5.1 选题背景5.2 国内…

阅读更多...

2025.1.20——一、[RCTF2015]EasySQL1 二次注入|报错注入|代码审计

2025.1.20——一、[RCTF2015]EasySQL1 二次注入|报错注入|代码审计

题目来源：buuctf [RCTF2015]EasySQL1 目录一、打开靶机，整理信息二、解题思路 step 1：初步思路为二次注入，在页面进行操作 step 2：尝试二次注入 step 3：已知双引号类型的字符型注入，构造…

阅读更多...

leetcode刷题记录（八十九）——35. 搜索插入位置

（一）问题描述 35. 搜索插入位置 - 力扣（LeetCode）35. 搜索插入位置 - 给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位…

阅读更多...

Python Typing: 实战应用指南

Python Typing: 实战应用指南

文章目录 1. 什么是 Python Typing？2. 实战案例：构建一个用户管理系统2.1 项目描述2.2 代码实现 3. 类型检查工具：MyPy4. 常见的 typing 用法5. 总结在 Python 中，静态类型检查越来越受到开发者的重视。typing 模块提供了一种方式…

阅读更多...

Linux之Tcp粘包笔记

Linux之Tcp粘包笔记

目录一.网络传输四层模型二.数据传输中数据包传输的两个限制概念三.数据传输的中粘包问题四.数据组装的原因 Nagle算法原理: 五.关闭Nagle优化处理粘包问题吗？ 六.粘包处理方法 a.设置消息边界： b.定义消息长度： 七.UDP是否会出…

阅读更多...

22_解析XML配置文件_List列表

22_解析XML配置文件_List列表

解析XML文件需要先 1.【加载XML文件】而【加载XML】文件有两种方式【第一种 —— 使用Unity资源系统加载文件】 TextAsset xml Resources.Load<TextAsset>(filePath); XmlDocument doc new XmlDocument(); doc.LoadXml(xml.text); 【第二种 —— 在C#文件IO…

阅读更多...

数据结构链表2

数据结构链表2

目录前言： 一，反转一个链表(迭代) 二，打印一个链表（递归） 三，反转一个链表(递归) 四，双向链表总结前言： 我们根据 [文章链表1] 可以知道链表相比较于数组的优缺点和计算机…

阅读更多...

Linux查看服务器的内外网地址

Linux查看服务器的内外网地址

目录： 1、内网地址2、外网地址3、ping时显示地址与真实不一致 1、内网地址 ifconfig2、外网地址 curl ifconfig.me3、ping时显示地址与真实不一致原因是dns缓存导致的，ping这种方法也是不准确的，有弊端不建议使用，只适用于测试…

阅读更多...

【kong gateway】5分钟快速上手kong gateway

【kong gateway】5分钟快速上手kong gateway

kong gateway的请求响应示意图安装下载对应的docker 镜像可以直接使用docker pull命令拉取，也可以从以下地址下载：kong gateway 3.9.0.0 docker 镜像 https://download.csdn.net/download/zhangshenglu1/90307400， postgres-13.tar http…

阅读更多...

缓存商品、购物车(day07)

缓存商品、购物车(day07)

缓存菜品问题说明问题说明：用户端小程序展示的菜品数据都是通过查询数据库获得，如果用户端访问量比较大，数据库访问压力随之增大。结果： 系统响应慢、用户体验差实现思路通过Redis来缓存菜品数据，减少数据库查询…

阅读更多...

Langchain+讯飞星火大模型Spark Max调用

Langchain+讯飞星火大模型Spark Max调用

1、安装langchain #安装langchain环境 pip install langchain0.3.3 openai -i https://mirrors.aliyun.com/pypi/simple #灵积模型服务 pip install dashscope -i https://mirrors.aliyun.com/pypi/simple #安装第三方集成,就是各种大语言模型 pip install langchain-comm…

阅读更多...

八股学习微服务篇

八股学习微服务篇

微服务篇常见面试内容Spring Cloud 常见组件注册中心Ribbon负载均衡策略服务雪崩常见面试内容 Spring Cloud 常见组件 Spring Cloud有5个常见组件： Eureka/Nacos:注册中心；Ribbon:负载均衡；Feign:远程调用；Hystrix/Sentinel:服…

阅读更多...

【xcode 16.2】升级xcode后mac端flutter版的sentry报错

【xcode 16.2】升级xcode后mac端flutter版的sentry报错

sentry_flutter 7.11.0 报错 3 errors in SentryCrashMonitor_CPPException with the errors No type named terminate_handler in namespace std (line 60) and No member named set_terminate in namespace std 替换sentry_flutter版本为： 8.3.0 从而保证oc的…

阅读更多...

electron打包客户端在rk3588上支持h265硬解

electron打包客户端在rk3588上支持h265硬解

目录前言 chromium是如何支持h265硬解 electron/chromium第一次编译 electron/chromium第二次编译前言我们的客户端程序是用electron打包的前端程序，其在rk3588主机上的linux环境运行。之前使用客户端查看h264编码的视频直播是没有问题的，但视频源…

阅读更多...

基于物联网的风机故障检测装置的设计与实现

基于物联网的风机故障检测装置的设计与实现

1 系统总体设计方案通过对风机故障检测装置的设计与实现的需求、可行性进行分析，本设计风机故障检测装置的设计与实现的系统总体架构设计如图2-1所示，系统风机故障检测装置采用STM32F103单片机作为控制器，并通过DS18B20温度传感器、ACS712电…

阅读更多...

为什么IDEA提示不推荐@Autowired❓️如果使用@Resource呢❓️

为什么IDEA提示不推荐@Autowired❓️如果使用@Resource呢❓️

前言在使用 Spring 框架时，依赖注入（DI）是一个非常重要的概念。通过注解，我们可以方便地将类的实例注入到其他类中，提升开发效率。Autowired又是被大家最为熟知的方式，但很多开发者在使用 IntelliJ IDEA …

阅读更多...

软件工程的概论

软件工程的概论

软件的概念与特点软件的定义软件程序数据文档软件的特征 1。软件是人开发的 2。软件生产是简单的拷贝 3。软件会多次生产 4。软件开发环境对产品影响很大 5。软件的双重作用一方面是一种产品另一方面是开发其他软件产品的工具。软件分类按软件功能&…

阅读更多...

1. 握手问题python解法——2024年省赛蓝桥杯真题

1. 握手问题python解法——2024年省赛蓝桥杯真题

原题传送门：1.握手问题 - 蓝桥云课问题描述小蓝组织了一场算法交流会议，总共有 50人参加了本次会议。在会议上，大家进行了握手交流。按照惯例他们每个人都要与除自己以外的其他所有人进行一次握手 (且仅有一次)。但有 7 个人，…

阅读更多...

【Uniapp-Vue3】setTabBar设置TabBar和下拉刷新API

【Uniapp-Vue3】setTabBar设置TabBar和下拉刷新API

一、setTabBar设置 uni.setTabBarItem({ index:"需要修改第几个", text:"修改后的文字内容" }) 二、tabBar的隐藏和显式 // 隐藏tabBar uni.hideTabBar(); // 显示tabBar uni.showTabBar(); 三、为tabBar右上角添加文本 uni.setTabBarBadge({ index:"…

阅读更多...

Visual Studio Code修改terminal字体

Visual Studio Code修改terminal字体

个人博客地址：Visual Studio Code修改terminal字体 | 一张假钞的真实世界默认打开中断后字体显示如下： 打开设置，搜索配置项terminal.integrated.fontFamily，修改配置为monospace。修改后效果如下：

阅读更多...

推荐文章

最新文章