Ubuntu系统3分钟本地部署DeepSeek-R1蒸馏模型,支持联网

news2025/2/21 14:03:27

本文提供Ubuntu + ollama + Page Assist,3步快速安装DeepSeek-R1蒸馏模型,支持联网,支持API。

目录

DeepSeek-R1安装分3步:

Step 1,  安装ollama(已安装可忽略)

Step 2, 下载DeepSeek-R1模型

Step 3, 从浏览器界面交互,支持联网


先看看DeepSeek-R1对蒸馏模型的“自我介绍”:

蒸馏模型的相关信息可以归纳如下:

一、概述

DeepSeek-R1蒸馏模型是通过蒸馏过程创建的DeepSeek-R1模型的更小、更高效的版本。蒸馏涉及将更大、更强大的模型(在本例中为DeepSeek-R1)的知识和推理能力转移到更小的模型中,使得较小的模型在推理任务上实现了有竞争力的性能,同时计算效率更高,部署更容易‌1。

二、背景与原理

  • ‌背景‌:DeepSeek-R1是DeepSeek AI开发的第一代推理模型,通过大规模强化学习(RL)进行训练,并在RL之前使用冷启动数据来增强推理性能‌2。
  • ‌原理‌:蒸馏是指将一个更大、更复杂的模型的知识转移到一个更小、更高效的模型中。知识蒸馏是由Geoffrey Hinton、Oriol Vinyals和Jeff Dean三位学者于2015年提出的一种模型压缩技术,其核心思想是通过将复杂的大模型(教师模型)的知识迁移到参数量更少、结构更简洁的小模型(学生模型)中,使得学生模型能够在保持高性能的同时,显著降低计算资源消耗并提升推理速度‌3。

三、主要型号与性能

DeepSeek-R1蒸馏模型包括多个型号,如DeepSeek-R1-Distill-Qwen系列(1.5B、7B、14B、32B)和DeepSeek-R1-Distill-Lama系列(8B、70B)等。这些蒸馏模型在推理基准测试中取得了令人印象深刻的结果,通常优于GPT-4o和Claude-3.5-Sonnet等较大的非推理模型‌1。

四、特点与优势

  • ‌高级推理能力‌:蒸馏模型在紧凑的开源包中封装了高级推理能力‌2。
  • ‌基准性能‌:在各种基准测试中表现出竞争力,使其成为开发人员和研究人员的宝贵工具‌2。
  • ‌本地部署‌:支持成本效益高的本地部署,允许用户在自己的硬件上运行模型‌2。
  • ‌研究与开发‌:适用于希望在较小模型中利用高级推理能力的研究人员‌2。
  • ‌实际应用‌:适用于需要强推理能力的任务,如问题解决、代码生成和数学计算‌2。

五、开源与获取

DeepSeek-R1蒸馏模型是开源的,允许研究人员和开发人员在各种应用程序中使用和构建它们。这些模型可以通过Hugging Face和Ollama等平台下载和使用‌2。

六、应用场景

蒸馏后的模型在保持强大性能的同时,更加轻量化,部署成本更低,适用于资源受限的环境,如移动端设备、物联网设备等。通过知识蒸馏技术,可以将大模型的知识迁移至轻量化的学生模型,从而实现模型的高效部署‌3。


DeepSeek-R1安装分3步:

Step 1,  安装ollama(已安装可忽略)
wget https://github.com/ollama/ollama/releases/download/v0.5.11/ollama-linux-arm64.tgz

tar -zxf ollama-linux-amd64.tgz


#或者

git clone https://github.com/ollama/ollama.git


# 运行ollama安装脚本


cd ollama-linux


sudo chmod 777 ./ollama-modelscope-install.sh


./ollama-modelscope-install.sh

验证安装:ollama -v

显示安装版本即可。

Step 2, 下载DeepSeek-R1模型

2.1. 启动ollama

ollama start

2.2. 下载模型(根据硬件和需求选择,14b大小9.0, 7b对应 4.7G)

ollama pull deepseek-r1:1.5b

ollama pull deepseek-r1:7b 

ollama pull deepseek-r1:8b 

ollama pull deepseek-r1:14b 

ollama pull deepseek-r1:32b 

ollama pull deepseek-r1:70b 

ollama pull deepseek-r1:671b

2.3. 使用ollama运行DeepSeek-R1, 比如运行70亿参数的Deepseek-R1:7b模型(新开一个terminal)

ollama run deepseek-r1:7b

Step 3, 从浏览器界面交互,支持联网

Firefox或者Chrome浏览器下载插件Page Assist,分别如下:

以Firefox Page Assist为例,打开直接显示使用本地Ollama安装的模型,可以设置开启联网:

API设置可以使用OpenAI 兼容 API,付费使用671B满血版,不再“服务器繁忙。。。。。”

使用案例:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2301959.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

谷粒商城—分布式高级②.md

认证服务 1. 环境搭建 创建gulimall-auth-server模块,导依赖,引入login.html和reg.html,并把静态资源放到nginx的static目录下 2. 注册功能 (1) 验证码倒计时 //点击发送验证码按钮触发下面函数 $("#sendCode").click(function () {//如果有disabled,说明最近…

C语言-----操作符的分类

1. 操作符的分类 •算术操作符&#xff1a; 、- 、 * 、/、% 移位操作符:<< >> 位操作符: & | ^ 赋值操作符: / 、 % 、 、- 、 *、/、 %、 <<、 >>、&、| 、 ^ 单⽬操作符&#xff1a;&#xff01;、 、- 、 & 、 * 、 、 …

PWM(脉宽调制)技术详解:从基础到应用实践示例

PWM&#xff08;脉宽调制&#xff09;技术详解&#xff1a;从基础到应用实践示例 目录 PWM&#xff08;脉宽调制&#xff09;技术详解&#xff1a;从基础到应用实践示例学前思考&#xff1a;一、PWM概述二、PWM的基本原理三、PWM的应用场景四、PWM的硬件配置与使用五、PWM的编程…

AI智能成长系统 | 应用探讨研究

研究背景 在现代家庭中&#xff0c;三岁宝宝的成长环境日益复杂。由于宝宝每天接触的人群多样&#xff0c;包括家庭成员、同龄小朋友以及可能的陌生人&#xff0c;其语言环境也相应地变得复杂多变。这种环境下&#xff0c;宝宝很容易接触到一些不适宜的语言&#xff0c;即俗称…

java 网络安全感知 网络安全学java

&#x1f345; 点击文末小卡片 &#xff0c;免费获取网络安全全套资料&#xff0c;资料在手&#xff0c;涨薪更快 实验五 java网络编程及安全 实验内容 1&#xff0e;掌握Socket程序的编写&#xff1b;2&#xff0e;掌握密码技术的使用&#xff1b;3&#xff0e;设计安全传输…

VisionMaster4.4 python脚本 图像处理 转换函数 爱之初体验

最近有接触过一丢丢VM4.3的模块开发. 一直有把python图像处理部分模块移植进来的打算 不过时间不够没来得及折腾.偶尔发现4.4支持py脚本 于是拿来折腾.一下午. 发现4.4支持python脚本,好开心. 首先安装VM4.4 注意一定要是4.4 打开后拖了一个模块. 但是发现import numpy imp…

python-leetcode 40.二叉树的层序遍历

题目&#xff1a; 给定二叉树的根节点root,返回其节点值得层序遍历&#xff08;即逐层从左到右访问所有节点&#xff09; 方法&#xff1a;广度优先搜索 # Definition for a binary tree node. # class TreeNode(object): # def __init__(self, val0, leftNone, rightNon…

蓝桥杯学习大纲

&#xff08;致酷德与热爱算法、编程的小伙伴们&#xff09; 在查阅了相当多的资料后&#xff0c;发现没有那篇博客、文章很符合我们备战蓝桥杯的学习路径。所以&#xff0c;干脆自己整理一篇&#xff0c;欢迎大家补充&#xff01; 一、蓝桥必备高频考点 我们以此为重点学习…

小米AX3000T 路由器如何开启 SSH 安装 OpenWRT 系统,不需要降级 v1.0.91 (2025)

小米AX3000T 路由器如何开启 SSH 安装 OpenWRT 系统&#xff0c;不需要降级 v1.0.91 &#xff08;2025&#xff09; 本文内容需要你有一定的 Linux 操作基础&#xff0c;最好是程序员那种&#xff0c;英文水平足够用才行。一般人不需要使用这么复杂的路由器操作系统&#xff0c…

水基试剂,湿式化学,清水,干式化学,干粉,卤烃清洁剂,二氧化碳灭火器UL8检测报告标准讲解:

水基试剂&#xff0c;湿式化学&#xff0c;清水&#xff0c;干式化学&#xff0c;干粉&#xff0c;卤烃清洁剂&#xff0c;二氧化碳灭火器UL检测报告标准讲解&#xff1a; 本政策涵盖的灭火器 水基试剂灭火器 水基试剂灭火器使用水基试剂带走燃烧三要素中的热量要素&#xf…

汽车免拆诊断案例 | 2010 款路虎揽胜车空调偶尔出风异常

故障现象  一辆2010款路虎揽胜车&#xff0c;搭载5.0 L发动机&#xff0c;累计行驶里程约为16万km。车主反映&#xff0c;接通空调开关后&#xff0c;有时出风忽大忽小&#xff0c;有时不出风&#xff0c;有时要等2 min左右才出风&#xff1b;有时两三天出现一次&#xff0c;…

Mac arm架构使用 Yarn 全局安装 Vue CLI

dgqdgqdeMacBook-Pro spid-admin % vue --version zsh: command not found: vue要使用 Yarn 安装 Vue CLI&#xff0c;你可以执行以下命令&#xff1a; yarn global add vue/cli这个命令会全局安装 Vue CLI&#xff0c;让你可以使用 vue 命令创建、管理 Vue.js 项目。以下是一…

成员函数定义后面加const是什么功能:C++中const成员函数的作用

成员函数定义后面加const是什么功能&#xff1a;C中const成员函数的作用 前言C中const成员函数的作用总结 前言 在PX4的代码中的位置控制模块中&#xff0c;有这样一个成员函数 void getAttitudeSetpoint(vehicle_attitude_setpoint_s &attitude_setpoint) const;该函数的…

DeepSeek智能测试助手:分类+推理+导出一站式工具

前言 测试开发工程师在日常工作中需要处理大量测试文档&#xff0c;并且这些文档需要被高效分类、清洗和管理&#xff0c;同时结合强大的 AI 推理能力&#xff08;如 DeepSeek 模型&#xff09;进行智能化处理和分析。为此&#xff0c;我们开发了一款基于 PyQt5 的 GUI 工具&a…

计算机毕业设计Python农产品推荐系统 农产品爬虫 农产品可视化 农产品大数据(源码+LW文档+PPT+讲解)

温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 作者简介&#xff1a;Java领…

「正版软件」PDF Reader - 专业 PDF 编辑阅读工具软件

PDF Reader 轻松查看、编辑、批注、转换、数字签名和管理 PDF 文件&#xff0c;以提高工作效率并充分利用 PDF 文档。 像专业人士一样编辑 PDF 编辑 PDF 文本 轻松添加、删除或修改 PDF 文档中的原始文本以更正错误。自定义文本属性&#xff0c;如颜色、字体大小、样式和粗细。…

日期类(完全讲解版)

1. 类的设计思想 Date 类的设计目的是为了封装和处理日期信息&#xff0c;它提供了对日期的基本操作&#xff0c;如日期加减、日期比较、日期合法性检查等。类中的私有成员 int _year, int _month, int _day 存储了日期的年、月、日。 类的声明和构造 Date 类的声明&#xff1…

洛谷 P10726 [GESP202406 八级] 空间跳跃 C++ 完整题解

一、题目链接 P10726 [GESP202406 八级] 空间跳跃 - 洛谷 二、解题思路 我们要对输入的挡板进行排序&#xff0c;按高度从高到低&#xff08;从小到大&#xff09;。 排序之后s和t都要更新。 struct Baffle {int l, r;int h;int id; } b[1005];void Sort() {sort(b 1, b 1 n…

【设计模式精讲】创建型模式之工厂方法模式(简单工厂、工厂方法)

文章目录 第四章 创建型模式4.2 工厂方法模式4.2.1 需求: 模拟发放奖品业务4.2.2 原始开发方式4.2.3 简单工厂模式4.2.3.1 简单工厂模式介绍4.2.3.2 简单工厂原理4.2.3.3 简单工厂模式重构代码4.2.3.4 简单工厂模式总结 4.2.4 工厂方法模式4.2.4.1 工厂方法模式介绍4.2.4.2 工厂…

【ROS2】【ROS2】RViz2源码分析(八):Display中订阅ROS2消息(使用Qt信号和槽传递ROS2消息)

1、简述 RViz2 涵盖了 Qt 和 ROS2 的技术点,前面介绍 DisplaysPanel 时,主要分析了Qt相关部分,参见博客: 【ROS2】RViz2源码分析(七):DisplaysPanel 中的树状模型/视图 本篇博客,将会一起学习 RViz2 中如何使用 ROS2,以 Display 中订阅 ROS2 消息为例。 2、通过话题…