DeepSeek 概述与本地化部署【详细流程】

news2025/2/20 14:21:55

 

目录

一、引言

1.1 背景介绍

1.2 本地化部署的优势

二、deepseek概述

2.1 功能特点

2.2 核心优势

三、本地部署流程

3.1 版本选择

3.2 部署过程

3.2.1 下载Ollama

3.2.2 安装Ollama 

3.2.3 选择 r1 模型

3.2.4 选择版本 

3.2.5 本地运行deepseek模型 

3.3.6 查看已有模型

3.3 使用客户端工具

4. 总结 


一、引言

1.1 背景介绍

DeepSeek,中文名为“深度求索”,是一家位于杭州的人工智能公司,由知名对冲基金 High-Flyer 投资支持。该公司专注于人工智能基础技术研究,并以其开源的大型语言模型在业内脱颖而出。通过将这些模型开源,深度求索不仅推动了技术的发展,还让更多开发者能够参与到人工智能的进步中来,这种开放的态度赢得了广泛的关注和认可。

1.2 本地化部署的优势

通过本地部署,可以完全掌控数据的存储和传输过程,减少了因第三方平台安全漏洞导致的数据泄露风险。避免了将敏感信息上传到云端的风险。这对于涉及个人隐私或商业机密的数据尤为重要。

二、deepseek概述

DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的AI大模型,具备强大的智能问答和多模态交互能力。它能够理解并生成自然语言,提供精准的回答和建议,适用于多个领域,如教育、科技、生活等。DeepSeek的核心优势在于其低成本、高效率的训练和推理能力,打破了传统N卡垄断,降低了大模型的使用门槛。

2.1 功能特点

(1) 深层次逻辑推理

DeepSeek 不仅能够处理简单的问题,还能在面对复杂问题时进行深入的逻辑分析。无论是多步骤的推理还是复杂的决策支持,DeepSeek 都能提供有力的帮助,帮助用户找到最佳解决方案。

(2) 文档解析与总结

无论您需要处理的是 PDF、Word 文档,还是其他格式的文件,DeepSeek 都能轻松应对。只需将文件上传给 DeepSeek,它就能快速分析内容,提取关键要点,并生成简洁明了的总结报告。这一功能特别适合需要高效处理大量文档的专业人士,如研究人员、律师或记者,显著提升工作效率。

(3) 实时信息获取

通过其强大的联网搜索功能,DeepSeek 能够实时抓取最新的信息和数据。这对于那些需要时刻了解最新动态的用户来说尤为重要,比如新闻工作者、市场分析师或任何需要及时获取最新资讯的人士。您可以依赖 DeepSeek 获取最前沿的信息,保持竞争力。当然这一点得结合实际,可能最新消息更新得时间点有所延后。

(4) 全方位应用场景

无论是对话聊天、语言翻译、创意写作、编程辅助、解题答疑、文献解读,还是旅行规划,DeepSeek 都能派上用场。简直是居家旅行必备良品!

2.2 核心优势

(1) 智能化

DeepSeek能够理解复杂的问题,并提供精准的解决方案。它通过深度学习自然语言处理技术,能够理解用户的需求并提供个性化的建议。

(2) 多功能性

DeepSeek在多个领域都有广泛的应用,包括学习、工作和生活。它可以用作学习助手、编程助手、写作助手、生活助手和翻译助手等,满足用户在不同场景下的需求。

(3) 易用性

DeepSeek通过自然语言交互,用户无需学习复杂的操作即可与模型进行对话。这种交互方式使得用户能够轻松地获取所需的信息和服务。

(4) 低成本

DeepSeek的训练和推理成本较低,打破了传统N卡垄断,降低了大模型的使用门槛。这使得更多的企业和个人能够使用高性能的AI服务。

(5) 高效率

DeepSeek在推理能力和响应速度上表现出色,能够快速处理复杂的查询和任务,提供准确的答案和解决方案。

(6) 开源生态

DeepSeek采用了开源策略,吸引了大量开发者和研究人员的参与,推动了AI技术的发展和应用。

(7) 本地部署优势

DeepSeek支持本地部署,确保数据隐私和安全,同时提供更高的性能和稳定性,适合对数据安全要求较高的企业和机构。

三、本地部署流程

3.1 版本选择

本地部署就是自己部署DeepSeek-R1模型,使用本地的算力,

主要瓶颈:内存+显存的大小。

特点:此方案不用联网。

适合:有数据隐私方面担忧的或者保密单位根本就不能上网的。

使用满血版:DeepSeek R1 671B 全量模型的文件体积高达 720GB,对于绝大部分人而言,本地资源有限,很难达到这个配置

蒸馏版本:

蒸馏版本链接:https://huggingface.co/deepseek-ai

开源2+6个模型。R1预览版和正式版的参数高达660B,非一般公司能用。为进一步平权, 于是他们就蒸馏出了6个小模型,并开源给社区。最小的为1.5B参数,10G显存可跑。

如果你要在个人电脑上部署,一般选择其他架构的蒸馏模型,本质是微调后的Llama或Qwen模型,基本32B以下,并不能完全发挥出DeepSeek R1的实力。

3.2 部署过程

3.2.1 下载Ollama

Ollama 是一个开源的大型语言模型(LLM)平台,旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。 Ollama 提供了一个简单的方式来加载和使用各种预训练的语言模型,支持文本生成、翻译、代码编写、问答等多种自然语言处理任务。 Ollama 的特点在于它不仅仅提供了现成的模型和工具集,还提供了方便的界面和 API,使得从文本生成、对话系统到语义分析等任务都能快速实现。

访问链接: Ollama

 根据自己的操作系统选择 ↓ ↓ ↓

3.2.2 安装Ollama 

就傻瓜式安装

安装完成后,检验是否安装成功。

`win+r` 输入 cmd  

命令行输入

ollama -v

能显示版本,就说明安装成功。

3.2.3 选择 r1 模型

 

3.2.4 选择版本 

b代表10亿参数量,7b就是70亿参数量。这里的671B是 HuggingFace经过4-bit 标准量化的,所以大小是404GB

ollama 支持 CPU 与 GPU 混合推理。将内存与显存之和大致视为 系统的 “总内存空间”。 如果你想运行404GB的671B,建议你的内存+显存能达到500GB以 上

除了模型参数占用的内存+显存空间(比如671B的404GB)以 外,实际运行时还需额外预留一些内存(显存)空间用于上 下文缓存。预留的空间越大,支持的上下文窗口也越大。所 以根据你个人电脑的配置,评估你选择部署哪一个版本。如 果你想运行404GB的671B,建议你的内存+显存能达到500GB 以上

这里我们以7B为例,大多数的电脑都能够运行起来。

3.2.5 本地运行deepseek模型 

再命令中,输入如下命令

ollama run deepseek-r1:7b

 

注意:

下载支持断点续传,如果下载中速度变慢,可以鼠标点击命 令行窗口,然后ctrl+c取消,取消后按方向键“上”,可以找到 上一条命令,即”ollama run deepseek-r1:7b“,按下回车会重新链接,按照之前进度接着下载。

下载完成后,自动进入模型,直接在命令行输入问题,即可得到回复。

获取帮助

/?

退出对话

/bye

 

3.3.6 查看已有模型

代码如下

ollama list

后续要运行模型,仍然使用之前的命令

ollama run deepseek-r1:7b

 

3.3 使用客户端工具

本地部署好模型之后,在命令行操作还是不太方便,我们继 续使用一些客户端工具来使用。

我们使用 Cherry Studio,Cherry Studio 是一个支持多模型服务的桌面客户端,为专业用户而打造,内置 30 多个行业的智能助手,帮助用户在多种场景下提升工作效率。

Cherry Studio的下载地址:https://cherry-ai.com/

 

就直接傻瓜式安装。

然后我们以Cherry Studio为例访问7b的蒸馏模型。

 如何这里没有显示r1模型,那么说明你之前没有安装好,去重新安装。

然后去选择模型,值得注意的是,使用时要确保ollama客户端已启动

 

然后提问 ↓ ↓ ↓

4. 总结 

以上就是deepseek本地化部署的全部内容,部署流程参考B站尚硅谷 👇 👇 👇30-部署方式3:本地算力部署_哔哩哔哩_bilibili

更多内容点击下面链接查看 👇 👇 👇

专栏管理-CSDN创作中心

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2298797.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

jenkins war Windows安装

Windows安装Jenkins 需求1.下载jenkins.war2.编写快速运行脚本3.启动Jenkins4.Jenkins使用 需求 1.支持在Windows下便捷运行Jenkins; 2.支持自定义启动参数; 3.有快速运行的脚步样板。 1.下载jenkins.war Jenkins下载地址:https://get.j…

3D打印技术:如何让古老文物重获新生?

如何让古老文物在现代社会中焕发新生是一个重要议题。传统文物保护方法虽然在一定程度上能够延缓文物的损坏,但在文物修复、展示和传播方面仍存在诸多局限。科技发展进步,3D打印技术为古老文物的保护和传承提供了全新的解决方案。我们来探讨3D打印技术如…

Vue h函数到底是个啥?

h 到底是个啥? 对于了解或学习Vue高阶组件(HOC)的同学来说,h() 函数无疑是一个经常遇到的概念。 那么,这个h() 函数究竟如何使用呢,又在什么场景下适合使用呢? 一、h 是什么 看到这个函数你可…

深入浅出 Python Logging:从基础到进阶日志管理

在 Python 开发过程中,日志(Logging)是不可或缺的调试和监控工具。合理的日志管理不仅能帮助开发者快速定位问题,还能提供丰富的数据支持,让应用更具可观测性。本文将带你全面了解 Python logging 模块,涵盖…

Android WindowContainer窗口结构

Android窗口是根据显示屏幕来管理,每个显示屏幕的窗口层级分为37层,0-36层。每层可以放置多个窗口,上层窗口覆盖下面的。 要理解窗口的结构,需要学习下WindowContainer、RootWindowContainer、DisplayContent、TaskDisplayArea、T…

2025年最新版1688平台图片搜索接口技术指南及Python实现

随着电商行业的蓬勃发展,1688作为国内领先的B2B交易平台,其商品搜索功能对于买家和卖家而言都至关重要。图片搜索作为其中的一种高级搜索方式,能够极大地提升用户的搜索体验和准确性。本文将详细介绍如何通过API接口实现1688平台的图片搜索功…

基于A*算法与贝塞尔曲线的路径规划与可视化:从栅格地图到平滑路径生成

引言 在机器人导航、自动驾驶和游戏开发等领域,路径规划是一个核心问题。如何高效地找到从起点到终点的最优路径,并且确保路径的平滑性和安全性,是许多应用场景中的关键挑战。本文将介绍一种结合A算法和贝塞尔曲线的路径规划方法,并通过Pygame实现可视化。我们将从栅格地图…

使用verilog 实现 cordic 算法 ----- 旋转模式

1-设计流程 ● 了解cordic 算法原理,公式,模式,伸缩因子,旋转方向等,推荐以下链接视频了解 cordic 算法。哔哩哔哩-cordic算法原理讲解 ● 用matlab 或者 c 实现一遍算法 ● 在FPGA中用 verilog 实现,注意…

【css】width:100%;padding:20px;造成超出100%宽度的解决办法 - box-sizing的使用方法 - CSS布局

问题 修改效果 解决方法 .xx {width: 100%;padding: 0 20px;box-sizing: border-box; } 默认box-sizing: content-box下, width 内容的宽度 height 内容的高度 宽度和高度的计算值都不包含内容的边框(border)和内边距(padding&…

贪心算法_翻硬币

蓝桥账户中心 依次遍历 不符合条件就反转 题目要干嘛 你就干嘛 #include <bits/stdc.h>#define endl \n using namespace std;int main() {ios::sync_with_stdio(0); cin.tie(0); cout.tie(0); string s; cin >> s;string t; cin >> t;int ret 0;for ( i…

深入HBase——引入

引入 前面我们通过深入HDFS到深入MapReduce &#xff0c;从设计和落地&#xff0c;去深入了解了大数据最底层的基石——存储与计算是如何实现的。 这个专栏则开始来看大数据的三驾马车中最后一个。 通过前面我们对于GFS和MapReduce论文实现的了解&#xff0c;我们知道GFS在数…

2025年02月12日Github流行趋势

项目名称&#xff1a;data-formulator 项目地址url&#xff1a;https://github.com/microsoft/data-formulator 项目语言&#xff1a;TypeScript 历史star数&#xff1a;4427 今日star数&#xff1a;729 项目维护者&#xff1a;danmarshall, Chenglong-MS, apps/dependabot, mi…

【落羽的落羽 数据结构篇】双向链表

文章目录 一、链表的分类二、双向链表1. 结构2. 申请一个新节点3. 尾部插入数据4. 头部插入数据5. 尾部删除数据6. 头部删除数据7. 在指定位置之后插入数据8. 删除指定位置节点9. 销毁链表 一、链表的分类 链表的分类实际上要从这三个方向分析&#xff1a;是否带头、单向还是双…

Golang的并发编程问题解决思路

Golang的并发编程问题解决思路 一、并发编程基础 并发与并行 在计算机领域&#xff0c;“并发”和“并行”经常被混为一谈&#xff0c;但它们有着不同的含义。并发是指一段时间内执行多个任务&#xff0c;而并行是指同时执行多个任务。在 Golang 中&#xff0c;通过 goroutines…

剑指offer第2版:搜索算法(二分/DFS/BFS)

查找本质就是排除的过程&#xff0c;不外乎顺序查找、二分查找、哈希查找、二叉排序树查找、DFS/BFS查找 一、p39-JZ3 找出数组中重复的数字&#xff08;利用特性&#xff09; 数组中重复的数字_牛客题霸_牛客网 方法1&#xff1a;全部排序再进行逐个扫描找重复。 时间复杂…

在 CentOS 上更改 SSH 默认端口以提升服务器安全性

&#x1f680; 作者主页&#xff1a; 有来技术 &#x1f525; 开源项目&#xff1a; youlai-mall ︱vue3-element-admin︱youlai-boot︱vue-uniapp-template &#x1f33a; 仓库主页&#xff1a; GitCode︱ Gitee ︱ Github &#x1f496; 欢迎点赞 &#x1f44d; 收藏 ⭐评论 …

2025年:边缘计算崛起下运维应对新架构挑战

一、引言 随着科技的飞速发展&#xff0c;2025年边缘计算正以前所未有的速度崛起&#xff0c;给运维行业带来了全新的架构挑战。在这个充满机遇与挑战的时代&#xff0c;美信时代公司的美信监控易运维管理软件成为运维领域应对这些挑战的有力武器。 二、边缘计算崛起带来的运维…

怎么理解 Spring Boot 的约定优于配置 ?

在传统的 Spring 开发中&#xff0c;大家可能都有过这样的经历&#xff1a;项目还没开始写几行核心业务代码&#xff0c;就已经在各种配置文件中耗费了大量时间。比如&#xff0c;要配置数据库连接&#xff0c;不仅要在 XML 文件里编写冗长的数据源配置&#xff0c;还要处理事务…

学习总结2.14

深搜将题目分配&#xff0c;如果是两个题目&#xff0c;就可以出现左左&#xff0c;左右&#xff0c;右左&#xff0c;右右四种时间分配&#xff0c;再在其中找最小值&#xff0c;即是两脑共同处理的最小值 #include <stdio.h> int s[4]; int sum0; int brain[25][25]; …

Electron 客户端心跳定时任务调度库调研文档 - Node.js 任务调度库技术调研文档

Electron 客户端心跳定时任务调度库调研文档 - Node.js 任务调度库技术调研文档 本文将对七个流行的定时任务调度库&#xff1a;node-cron、rxjs、bull、node-schedule、agenda、bree、cron。这些库都可以用来处理定时任务&#xff0c;但它们的特点和适用场景有所不同。我们将从…