使用ollama在本地部署一个deepseek大模型

news2025/2/3 20:09:36

文章目录

      • 为什么选择本地化部署
      • 需要用到什么
      • 作者使用的什么环境
      • 如何根据自己的电脑或服务器配置选择自己能部署的大模型
  • 一、Ollama
    • 1、下载Ollama
    • 2、安装Ollama
  • 二、DeepSeek R1
    • 1、下载DeepSeek R1
    • 2、安装DeepSeek R1
  • 三、ChatBox AI
    • 1、下载ChatBox AI
    • 2、安装ChatBox AI
    • 3、连接大模型

DeepSeek最近很火,但是使用的时候因为种种原因,经常无响应,要不排队,要不无法联网搜索,研究了一下,发现自己的破显卡还能试着本地部署运行一下,索性部署记录了一下这个过程分享出来。

为什么选择本地化部署

  • 响应速度快(建立在GPU卡足够好的情况下)
  • 隐私性,不用把自己的数据上传到第三方
  • 可以训练自己的私有大模型

需要用到什么

  • Ollama,支持各种大模型方便的进行本地化部署
  • ChatBox AI,一个UI客户端,可以让我们方便美观的使用大模型
  • Windows10及以上版本的操作系统

作者使用的什么环境

  • Windows10操作系统
  • CPU:AMD Ryzen 5 5600
  • 内存:32GB
  • 硬盘:50GB
  • GPU:AMD Radeon RX Vega56 8GB

如何根据自己的电脑或服务器配置选择自己能部署的大模型

https://apxml.com/posts/gpu-requirements-deepseek-r1

注:本文以部署1.5b(15亿参数)为例,参数越多的模型越强大,1.5b相当于一个小学生,有条件的尽量部署更高的模型使用

一、Ollama

1、下载Ollama

访问Ollama官网,https://ollama.com/,下载对应操作系统下的安装包
在这里插入图片描述
在这里插入图片描述

2、安装Ollama

在这里插入图片描述
Ollama的安装没有什么特殊配置,直接Install即可,需要注意的是,Ollama默认安装在C盘,包括后面的大模型也是,如果需要移动到其他磁盘位置,可以自行移动并且需要修改对应的环境变量即可。
在这里插入图片描述
安装完成后我们可以在右下角任务栏里看到已经运行起来的ollama
在这里插入图片描述
也可以通过cmd窗口查询ollama版本确定是否安装成功

ollama -v

在这里插入图片描述

二、DeepSeek R1

1、下载DeepSeek R1

继续来到Ollama官网的Models页面,https://ollama.com/search,查询下载DeepSeek R1大模型
在这里插入图片描述
我选择的是一个最小的模型,1.5b,数字越大代表参数越多,所需资源也越多,1.5b=15亿参数,下拉调整到1.5b模型,点击后面的复制按钮复制下载运行命令
在这里插入图片描述

2、安装DeepSeek R1

粘贴我们刚才复制的命令到cmd窗口中并回车运行,开始下载安装

ollama run deepseek-r1:1.5b

在这里插入图片描述

下载完成我们看到success的提示,就可以使用大模型了
在这里插入图片描述
一些可能会使用到的ollama命令

  • 查看已经安装的大模型
ollama list
  • 删除安装的大模型
ollama rm name

在这里插入图片描述

三、ChatBox AI

虽然到上一步大模型已经可以使用了,但是在cmd窗口中使用总是感觉很别扭,包括复制粘贴也不是那么顺手,那么我们可以安装一个ChatBox AI来连接我们部署的大模型使用

1、下载ChatBox AI

https://chatboxai.app/zh
在这里插入图片描述

2、安装ChatBox AI

安装过程没有什么特殊配置,一路下一步即可
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3、连接大模型

进入ChatBox AI设置页面,选择模型提供方为OLLAMA API,API域名无需修改,模型选择我们安装好的1.5b,保存即可
在这里插入图片描述
到这里,我们就可以愉快的使用大模型了
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2291423.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

10 Flink CDC

10 Flink CDC 1. CDC是什么2. CDC 的种类3. 传统CDC与Flink CDC对比4. Flink-CDC 案例5. Flink SQL 方式的案例 1. CDC是什么 CDC 是 Change Data Capture(变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包括数据或数…

【含文档+PPT+源码】基于微信小程序连锁药店商城

项目介绍 本课程演示的是一款基于微信小程序连锁药店商城,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的 Java 学习者。 1.包含:项目源码、项目文档、数据库脚本、软件工具等所有资料 2.带你从零开始部署运行本套系统 3.该项目附带的…

[免费]微信小程序智能商城系统(uniapp+Springboot后端+vue管理端)【论文+源码+SQL脚本】

大家好,我是java1234_小锋老师,看到一个不错的微信小程序智能商城系统(uniappSpringboot后端vue管理端),分享下哈。 项目视频演示 【免费】微信小程序智能商城系统(uniappSpringboot后端vue管理端) Java毕业设计_哔哩哔哩_bilibili 项目介绍…

2025年02月02日Github流行趋势

项目名称:oumi 项目地址url:https://github.com/oumi-ai/oumi 项目语言:Python 历史star数:1416 今日star数:205 项目维护者:xrdaukar, oelachqar, taenin, wizeng23, kaisopos 项目简介:构建最…

vue入门到实战 三

目录 3.1 v-bind 3.1.1 v-bind指令用法 ​编辑3.1.2 使用v-bind绑定class 3.1.3 使用v-bind绑定style 3.2.1 v-if指令 3.2.1 v-if指令 3.2.2 v-show指令 ​3.3 列表渲染指令v-for 3.3.1 基本用法 3.3.2 数组更新 3.3.3 过滤与排序 3.4 事件处理 3.4.1 使用v-on指令…

实验六 项目二 简易信号发生器的设计与实现 (HEU)

声明:代码部分使用了AI工具 实验六 综合考核 Quartus 18.0 FPGA 5CSXFC6D6F31C6N 1. 实验项目 要求利用硬件描述语言Verilog(或VHDL)、图形描述方式、IP核,结合数字系统设计方法,在Quartus开发环境下&#xff…

java SSM框架 商城系统源码(含数据库脚本)

商城购物功能,项目代码,mysql脚本,html等静态资源在压缩包里面 注册界面 登陆界面 商城首页 文件列表 shop/.classpath , 1768 shop/.project , 1440 shop/.settings/.jsdtscope , 639 shop/.settings/org.eclipse.core.resources.prefs , …

Unet 改进:在encoder和decoder间加入TransformerBlock

目录 1. TransformerBlock 2. Unet 改进 3. 完整代码 Tips:融入模块后的网络经过测试,可以直接使用,设置好输入和输出的图片维度即可 1. TransformerBlock TransformerBlock是Transformer模型架构的基本组件,广泛应用于机器翻译、文本摘要和情感分析等自然语言处理任务…

【Linux系统】信号:认识信号 与 信号的产生

信号快速认识 1、生活角度的信号 异步:你是老师正在上课,突然有个电话过来资料到了,你安排小明过去取资料,然后继续上课,则小明取资料这个过程就是异步的 同步:小明取快递,你停下等待小明回来再…

一、html笔记

(一)前端概述 1、定义 前端是Web应用程序的前台部分,运行在PC端、移动端等浏览器上,展现给用户浏览的网页。通过HTML、CSS、JavaScript等技术实现,是用户能够直接看到和操作的界面部分。上网就是下载html文档,浏览器是一个解释器,运行从服务器下载的html文件,解析html、…

PyQt5超详细教程终篇

PyQt5超详细教程 前言 接: [【Python篇】PyQt5 超详细教程——由入门到精通(序篇)](【Python篇】PyQt5 超详细教程——由入门到精通(序篇)-CSDN博客) 建议把代码复制到pycahrm等IDE上面看实际效果,方便理…

洛谷 P8724 [蓝桥杯 2020 省 AB3] 限高杆

洛谷题目传送门 题目描述 某市有 n 个路口,有 m 段道路连接这些路口,组成了该市的公路系统。其中一段道路两端一定连接两个不同的路口。道路中间不会穿过路口。 由于各种原因,在一部分道路的中间设置了一些限高杆,有限高杆的路…

虚幻UE5手机安卓Android Studio开发设置2025

一、下载Android Studio历史版本 步骤1:虚幻4.27、5.0、5.1、5.2官方要求Andrd Studio 4.0版本; 5.3、5.4、5.5官方要求的版本为Android Studio Flamingo | 2022.2.1 Patch 2 May 24, 2023 虚幻官网查看对应Andrd Studiob下载版本: https:/…

JavaWeb入门-请求响应(Day3)

(一)请求响应概述 请求(HttpServletRequest):获取请求数据 响应(HttpServletResponse):设置响应数据 BS架构:Browser/Server,浏览器/服务器架构模式。客户端只需要浏览器就可访问,应用程序的逻辑和数据都存储在服务端(维护方便,响应速度一般) CS架构:Client/ser…

【Rust】18.2. 可辩驳性:模式是否会无法匹配

喜欢的话别忘了点赞、收藏加关注哦(加关注即可阅读全文),对接下来的教程有兴趣的可以关注专栏。谢谢喵!(・ω・) 18.2.1. 模式的两种形式 模式有两种形式: 可辩驳的(可失败的&…

【SLAM】于AutoDL云上GPU运行GCNv2_SLAM的记录

配置GCNv2_SLAM所需环境并实现AutoDL云端运行项目的全过程记录。 1. 引子 前几天写了一篇在本地虚拟机里面CPU运行GCNv2_SLAM项目的博客:链接,关于GCNv2_SLAM项目相关的介绍请移步此文章,本文不再重复说明。 GCNv2: Efficient Corresponde…

【自然语言处理(NLP)】基于Transformer架构的预训练语言模型:BERT 训练之数据集处理、训练代码实现

文章目录 介绍BERT 训练之数据集处理BERT 原理及模型代码实现数据集处理导包加载数据生成下一句预测任务的数据从段落中获取nsp数据生成遮蔽语言模型任务的数据从token中获取mlm数据将文本转换为预训练数据集创建Dataset加载WikiText-2数据集 BERT 训练代码实现导包加载数据构建…

41【文件名的编码规则】

我们在学习的过程中,写出数据或读取数据时需要考虑编码类型 火山采用:UTF-16 易语言采用:GBK php采用:UTF-8 那么我们写出的文件名应该是何种编码的?比如火山程序向本地写出一个“测试.txt”,理论上这个“测…

使用MATLAB进行雷达数据采集可视化

本文使用轮趣科技N10雷达,需要源码可在后台私信或者资源自取 1. 项目概述 本项目旨在通过 MATLAB 读取 N10 激光雷达 的数据,并进行 实时 3D 点云可视化。数据通过 串口 传输,并经过解析后转换为 三维坐标点,最终使用 pcplayer 进…

沙皮狗为什么禁养?

各位铲屎官们,今天咱们来聊聊一个比较敏感的话题:沙皮狗为什么会被禁养?很多人对沙皮狗情有独钟,但有些地方却明确禁止饲养这种犬种,这背后到底是什么原因呢?别急,今天就来给大家好好揭秘&#…