Ollama 部署本地大语言模型

news2025/2/10 20:48:39

一、下载安装ollama

1.百度  ollama

Ollama

2.点击下载

可以复制下载链接,使用下载器下载。

3.双击安装

默认安装目录:C:\Users\用户名\AppData\Local\Programs\Ollama

二、更改模型下载目录

0.默认下载目录 (跳过)

之前没下载过模型,不涉及转移模型,可以跳过此步骤

C:\Users\用户名\.ollama\models\

 如果之前下载过了,可将默认目录里的

复制到更改后的目录里

1.打开系统属性

右键点击桌面上的“此电脑”或“计算机”图标,选择“属性”。

2.进入高级系统设置

在系统属性窗口中,点击左侧的“高级系统设置”按钮。

3.编辑环境变量

4.新建环境变量

在“环境变量”窗口中,找到“系统变量”部分,点击“新建”按钮。

输入变量名为OLLAMA_MODELS

在“变量值”文本框中输入希望保存模型文件的新目录路径,例如D:\OllamaModels

5.保存并重启Ollama

点击“确定”按钮保存设置。

重启Ollama应用,以使新的环境变量生效。

为了保证生效,可以重启电脑。

三、常用命令

1.win+R键--->cmd

输入    ollama 

这是Ollama命令行工具的帮助信息,它列出了所有可用的命令和标志,以及如何使用它们。以下是对这些命令和标志的详细解释:

命令

  1. serve
    • 描述启动Ollama服务,使其能够处理模型运行和API请求。
    • 用法ollama serve
  2. create
    • 描述:使用包含模型信息的Modelfile来创建一个新模型。
    • 用法ollama create /path/to/Modelfile
  3. show
    • 描述:显示特定模型的详细信息,如模型名称、版本等。
    • 用法ollama show [模型名称]
  4. run
    • 描述:运行一个已安装的模型,执行某些任务。
    • 用法ollama run [模型名称]
  5. stop
    • 描述:停止一个正在运行的模型。
    • 用法ollama stop [模型名称]
  6. pull
    • 描述:从模型注册表中拉取一个模型到本地使用。
    • 用法ollama pull [模型名称]
  7. push
    • 描述:将本地模型推送到模型注册表中,以便他人或其他系统使用。
    • 用法ollama push [模型名称]
  8. list
    • 描述:列出本地所有可用的模型。
    • 用法ollama list 或 ollama ls
  9. ps
    • 描述:列出当前正在运行的模型。
    • 用法ollama ps
  10. cp
    • 描述:复制一个模型到另一个位置或给定名称的地方。
    • 用法ollama cp [原模型名称] [新模型名称]
  11. rm
    • 描述:删除一个已安装的模型。
    • 用法ollama rm [模型名称]
  12. help
    • 描述:获取有关Ollama任何命令的帮助信息。
    • 用法ollama help [命令名称] 或 ollama --help

标志

  • -h, --help
    • 描述:显示帮助信息,包括所有可用命令和标志。
    • 用法:在任何命令后添加 -h 或 --help 以获取该命令的详细帮助信息。
  • -v, --version
    • 描述:显示Ollama工具的版本信息。
    • 用法ollama -v 或 ollama --version

注意: create命令,可以基于某个模型创建指定角色的模型。

具体用法可以搜索:

ollama create怎么用?

ollama 

四、下载模型

1.搜索模型

2.下载模型

(模型越大功能越强,但是所需要的电脑硬件设备越高,根据个人情况自行选择) 

命令粘贴的到 命令窗口(win+R键--->cmd)

ollama run deepseek-r1:7b

下载慢怎么办?

第一步

点击选中终端窗口,然后点击 ctr+c 暂停下载。

第二步

重新粘贴 命令 ,等待重新链接即可。

注意事项:

有小概率出现从头开始下载的可能性,目前题主暂未出现此情况。

五、测试

run命令 运行存在的模型就是打开,不存在的模型,就是先下载再打开。 

可直接在此窗口进行对话

 六、基于已有模型,创造模型

github有教程 ,ollama github页面搜索 Create a Modelfile 定位到指定位置。 

在Ollama中,你还可以自定义模型的启动提示词来调整其行为。例如,要自定义 deepseek模型,你首先需要拉取(下载)该模型:(上面操作已经下载过了,跳过)

ollama pull deepseek-r1:7b

创建一个Modelfile,在其中设置参数和系统消息:

FROM deepseek-r1:7b

# 设置创造力参数,1表示更高的创造性,较低则表示更加连贯
PARAMETER temperature 1

# 设置系统消息
SYSTEM """
You are Mario from Super Mario Bros. Answer as Mario, the assistant, only.
"""

创建并运行自定义模型:

ollama create custom-model-name -f F:\路径\Modelfile
ollama run custom-model-name

 七、安装web UI

1.搜索 page Assist github

2.解压

3.Chrome浏览器加载插件

4.Ctrl+Shift+L 打开

5.设置中文

6.RAG设置

 

Ollama 下载 模型 

ollama pull nomic-embed-text

刷新当前页面

可以设置联网或上传图片等。

八、Ollama手动导入GGUF模型文件

1.下载模型文件

进入该网站https://huggingface.co/

(其他平台)

点击模型


直接搜索模型关键词,以QWen2.5 GGUF为例

可以复制下载链接,到下载器下载

2.创建一个Modelfile

在其中设置参数和系统消息:

# 指定本地模型的位置
FROM F:\ollama\QWen_GGUF\Qwen2.5-1.5B-Instruct.Q5_K_S.gguf
 
# 指定模型参数
PARAMETER temperature 0.7
 
# 设置系统消息,定义助手行为
SYSTEM """
You are a helpful assistant.
"""

3.执行以下命令

ollama create QWen_2.5_gguf -f F:\ollama\QWen_GGUF\qw_Modelfile
ollama run custom-model-name

4.注意

page Assist使用时,从新配置设置一遍,否则可能出现不智能的情况

 九、使用API方式远程调用ollama模型

1.设置环境变量(参考第二步)

OLLAMA_HOST="0.0.0.0:11434"

 2.命令

ollama serve

3.配置防火墙(可选)

  • 如果希望从外部网络访问 Ollama server,需要在 Windows 防火墙中开放 Ollama 使用的端口(默认是 11434)。

  • 打开“控制面板” -> “系统和安全” -> “Windows Defender 防火墙”,点击“高级设置”,在“入站规则”中创建一条新的规则,允许 TCP 端口 11434 的入站连接。

3.下载客户端 

①搜索chatbox

Chatbox AI官网:办公学习的AI好助手,全平台AI客户端,官方免费下载

​ ②下载

③下一步、下一步安装就行

 4.配置客户端

 设置好IP、端口后保存.

5、测试

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2295973.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

pytest-xdist 进行多进程并发测试!

在软件开发过程中,测试是确保代码质量和可靠性的关键步骤。随着项目规模的扩大和复杂性的增加,测试用例的执行效率变得尤为重要。为了加速测试过程,特别是对于一些可以并行执行的测试用 例,pytest-xdist 提供了一种强大的工具&…

24.ppt:小李-图书策划方案【1】

目录 NO1234​ NO5678​ NO1234 新建PPT两种方式👇docx中视图→导航窗格→标题1/2/3ppt新建幻灯片→从大纲→重置开始→版式设计→主题插入→表格 NO5678 SmartArt演示方案:幻灯片放映→自定义幻灯片放映→新建→选中添加

模型 替身决策

系列文章分享模型,了解更多👉 模型_思维模型目录。替身决策,换位思考,多角度决策。 1 替身决策模型的应用 1.1 替身决策模型在面试中的应用-小李的求职面试 小李是一名应届毕业生,正在积极寻找工作机会。在面试过程中…

ESP32S3读取数字麦克风INMP441的音频数据

ESP32S3 与 INMP441 麦克风模块的集成通常涉及使用 I2S 接口进行数字音频数据的传输。INMP441 是一款高性能的数字麦克风,它通过 I2S 接口输出音频数据。在 Arduino 环境中,ESP32S3 的开发通常使用 ESP-IDF(Espressif IoT Development Framew…

docker环境下部署face-search开源人脸识别模型

由于我们是直接将face-search部署在docker容器中的,所以,在部署之前一定要检查一下自己的docker环境,要不然部署过程中会出现各种各样的问题 我这里的docker环境是 一、安装docker环境 如果docker版本比较低或者docker-compose的版本比较低的情况下,部署的时候docker的yml…

飞牛fnOS安装了Airplay没有声音找不到声卡的问题

主要问题描述:我在飞牛的Docker里安装了 Airplay, 这样把NAS接一个外接音箱,就可以当成无线音箱来用,直接把手机的音乐播放投到上面来播放。 (文章底部有写我是怎么安装Airplay的) 我的报错如下&#xff1…

netcore openTelemetry+prometheus+grafana

一、netcore项目 二、openTelemetry 三、prometheus 四、grafana添加Dashborad aspire/src/Grafana/dashboards at main dotnet/aspire GitHub 导入:aspnetcore.json和aspnetcore-endpoint.json 效果:

全程Kali linux---CTFshow misc入门(38-50)

第三十八题: ctfshow{48b722b570c603ef58cc0b83bbf7680d} 第三十九题: 37换成1,36换成0,就得到长度为287的二进制字符串,因为不能被8整除所以,考虑每7位转换一个字符,得到flag。 ctfshow{5281…

用 DeepSeek + Kimi 自动做 PPT,效率起飞

以下是使用 DeepSeek Kimi 自动做 PPT 的详细操作步骤: 利用 DeepSeek 生成 PPT 内容: 访问 DeepSeek 官网,完成注册/登录后进入对话界面。输入指令,例如“请用 Markdown 格式生成一份关于[具体主题]的 PPT 大纲,需包…

自动驾驶数据集三剑客:nuScenes、nuImages 与 nuPlan 的技术矩阵与生态协同

目录 1、引言 2、主要内容 2.1、定位对比:感知与规划的全维覆盖 2.2、数据与技术特性对比 2.3、技术协同:构建全栈研发生态 2.4、应用场景与评估体系 2.5、总结与展望 3、参考文献 1、引言 随着自动驾驶技术向全栈化迈进,Motional 团…

DeepSeekMoE 论文解读:混合专家架构的效能革新者

论文链接:DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models 目录 一、引言二、背景知识(一)MoE架构概述(二)现有MoE架构的问题 三、DeepSeekMoE架构详解(一&a…

【python】简单的flask做页面。一组字母组成的所有单词。这里的输入是一组字母,而输出是所有可能得字母组成的单词列表

目录结构如下: https://github.com/kaede316/Pythons_pj.git 效果: 后续可扩展为工具网站: 更新 2025.02.09 1、增加等间距制作人 时间信息 2、增加判断润年的功能

[权限提升] Linux 提权 维持 — 系统错误配置提权 - Sudo 滥用提权

关注这个专栏的其他相关笔记:[内网安全] 内网渗透 - 学习手册-CSDN博客 0x01:Sudo 滥用提权原理 Sudo 是一个 Linux 系统管理命令,它允许系统管理员授予普通用户以指定身份执行指定命令的权限。该命令不仅减少了 Root 用户的登录时间和管理时…

如何修改IDEA的maven远程仓库地址

IDEA自动的maven的远程仓库地址为国外地址&#xff0c;导致下载依赖时很慢&#xff0c;通过如下方法可以将其修改为国内地址 选中模块&#xff0c;右击&#xff0c;创建setting.xml文件 添加阿里仓库地址 <mirrors><mirror><id>nexus-aliyun</id><…

LLMs之DeepSeek r1:TinyZero(复现 DeepSeek R1 Zero 的核心功能)的简介、安装和使用方法、案例应用之详细攻略

LLMs之DeepSeek r1&#xff1a;TinyZero(复现 DeepSeek R1 Zero 的核心功能)的简介、安装和使用方法、案例应用之详细攻略 目录 TinyZero的简介 1、TinyZero的特点 TinyZero的安装和使用方法 1、安装 创建 conda 环境 数据准备 (倒计时任务) 训练执行 单GPU (适用于模型…

亚博microros小车-原生ubuntu支持系列:23 人脸识别追踪

背景知识&#xff1a; 本节跟上一篇的物体识别追踪类似&#xff0c;换了opencv的函数来做人脸识别 函数定义如下&#xff1a; detectMultiScale(image, scaleFactor, minNeighbors, flags, minSize, maxSize)scaleFactor参数控制每个图像序列的缩放比例。该参数决定了在每个…

微信小程序调用企业微信客户服务插件联通企业微信客服

需求背景:用户在小程序页面点击按钮添加企业微信的客服 相关技术:基于uniapp开发的微信小程序 插件名称:企业微信客户服务插件「联系我」插件 - 文档 - 企业微信开发者中心 仔细阅读文档「联系我」插件 - 文档 - 企业微信开发者中心 以下是我的实例代码 1.首先先小程序管…

【AI实践】deepseek支持升级git

当前Windows 11 WSL的git是2.17&#xff0c;Android Studio提示需要升级到2.19版本 网上找到指导文章 安装git 2.19.2 cd /usr/src wget https://www.kernel.org/pub/software/scm/git/git-2.19.2.tar.gz tar xzf git-2.19.2.tar.gz cd git-2.19.2 make prefix/usr/l…

Maven 安装配置(完整教程)

文章目录 一、Maven 简介二、下载 Maven三、配置 Maven3.1 配置环境变量3.2 Maven 配置3.3 IDEA 配置 四、结语 一、Maven 简介 Maven 是一个基于项目对象模型&#xff08;POM&#xff09;的项目管理和自动化构建工具。它主要服务于 Java 平台&#xff0c;但也支持其他编程语言…

w196Spring Boot高校教师科研管理系统设计与实现

&#x1f64a;作者简介&#xff1a;多年一线开发工作经验&#xff0c;原创团队&#xff0c;分享技术代码帮助学生学习&#xff0c;独立完成自己的网站项目。 代码可以查看文章末尾⬇️联系方式获取&#xff0c;记得注明来意哦~&#x1f339;赠送计算机毕业设计600个选题excel文…