用 Python 实现 DeepSeek R1 本地化部署

news2025/2/22 10:23:57

DeepSeek R1 以其出色的表现脱颖而出，不少朋友想将其本地化部署，网上基于 ollama 的部署方式有很多，但今天我要带你领略一种全新的方法 —— 使用 Python 实现 DeepSeek R1 本地化部署，让你轻松掌握，打造属于自己的 AI 小助手。

硬件环境

要想让 DeepSeek R1 顺畅运行，硬件得跟上。你的电脑至少得配备 8GB 内存，要是想运行更大的模型，比如 7B 及以上的，那最好有更强劲的 CPU 和 GPU，内存也得相应增加。

Python 环境

安装 Python 3.8 及以上版本，这是后续部署的关键工具，Python 丰富的库和灵活的编程特性，能帮我们更好地实现部署。

安装依赖包

打开命令行工具，使用 pip 安装 DeepSeek R1 运行所需要的依赖包。比如，如果模型依赖一些自然语言处理相关的库，像 NLTK、transformers 等，都可以通过 pip 一键安装：

pip install numpy torch nltk transformers

Python 代码配置与运行：

编写 Python 脚本，导入必要的库，比如 transformers 库，用于加载和处理 DeepSeek R1 模型：（这里以1.5B模型为例）

from transformers import AutoTokenizer, AutoModelForCausalLM
import os

model_name = "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B"
model_path = "./model/deepseek_1.5b"

if not os.path.exists(model_path):
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(model_name)
    print("Model loaded successfully.")
    model.save_pretrained(model_path)
    tokenizer.save_pretrained(model_path)
else:
    tokenizer = AutoTokenizer.from_pretrained(model_path)
    model = AutoModelForCausalLM.from_pretrained(model_path)

实现与模型的交互逻辑，将输入传递给模型进行处理，并输出模型的回复：

# 使用模型生成文本
input_text = "你好，世界！"
input_ids = tokenizer.encode(input_text, return_tensors="pt")
output = model.generate(input_ids, max_length=100)
print(tokenizer.decode(output[0], skip_special_tokens=True))

等待模型加载完成，并完成推理结果如下：

完整代码：

from transformers import AutoTokenizer, AutoModelForCausalLM
import os

model_name = "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B"
model_path = "./model/deepseek_1.5b"

if not os.path.exists(model_path):
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(model_name)
    print("Model loaded successfully.")
    model.save_pretrained(model_path)
    tokenizer.save_pretrained(model_path)
else:
    tokenizer = AutoTokenizer.from_pretrained(model_path)
    model = AutoModelForCausalLM.from_pretrained(model_path)

# 使用模型生成文本
input_text = "你好，世界！"
input_ids = tokenizer.encode(input_text, return_tensors="pt")
output = model.generate(input_ids, max_length=100)
print(tokenizer.decode(output[0], skip_special_tokens=True))

通过以上用 Python 实现 DeepSeek R1 本地化部署的步骤，你就可以在自己的设备上轻松运行 DeepSeek R1，享受本地化 AI 带来的便捷与高效，无论是用于日常的文本处理，还是更专业的自然语言处理任务，都能轻松应对。赶紧动手试试吧！

网络问题

特别提醒：如果执行代码时，报如下错误，表示您无法访问网站https://huggingface.co来下载相关资源，请通过合理方式保障主机能够访问网站https://huggingface.co