保姆级离线+windows环境+私有化部署大模型

保姆级离线+windows环境+私有化部署大模型

news2026/2/14 2:17:54

基于gis数据的高敏感高保密性要求，相信gis的小伙伴都有如下的需求：在内网，无外网环境下，部署自己的私有化大模型。

1.环境背景：

没有Linux环境，只是windows

无外网，内网环境

2.安装部署过程：

一、Ollama下载安装
进入官网：github.com
点击Download
选择Windows，点击Download for Windows (Preview)
默认安装。

安装完成以后在win+r，输入cmd，弹出dos命令界面。输入ollama。

右侧状态栏出来小绵羊就算成功了。

二、创建环境变量

OLLAMA_MODELS，随意指定变量值，如图所示：

OLLAMA_MODELS

二、支持的模型

三、下载模型的地址

（1）国内大模型源文件下载地址https://modelscope.cn/models

（2）国外大模型源文件下载地址https://huggingface.co/models

三、大模型下载安装

1.我选择的阿里qwen2，下载Qwen2

我这是离线部署，只能把几个g的模型下载到本地，然后安装，如果不是离线，一个命令就搞定了，别在我这个文章晃了。

进入魔塔社区下载：通义千问2-7B-Instruct-GGUF · 模型库 (modelscope.cn)

Qwen2是刚出来的号称国内最强开源大模型。之前还有1.5的，肯定要选2的吧，选择instruct就是内含训练好的模型。不带的需要自己训练。 GGUF文件就是模型文件。有0.5B，7B，14B……72B，前面的数字是存储权重的位数（精度）参数越大越费显存，数字越大性能越强。

k是在所有的attention和feed_forward张量上将精度提升2位，m是在一半的attention和feed_forward张量上将精度提升2位。

instruct是训练好的模型，包含从0.5亿到720亿参数的指令调优语言模型，包括一个专家混合模型。具体来说，这里有一个指令调优的7亿参数Qwen2模型。

废话一下：传说又有2.5更牛，通义千问2.5是一个集成了通义大模型全栈能力的全能AI助手。它支持多种文件格式进行处理，包括PDF、Word、Excel等，且在文档处理方面，支持单次处理最长1000万字、100个文档。此外，于2024年，该APP更名为“通义APP”，其基模的性能可与GPT-4 Turbo相媲美。

模型可以去ollama gallary里面选择支持哪些模型都可以自己去选。

在下面列表按照自己的机器内存选一个合适自己的，选好以后，在右侧“下载”下载到本地就行，不用注册。怎么选呢？前面tab页有“模型介绍”可以翻过去查一下。

前面可以看模型介绍：
先在最下面点击效率评估，看下各个模型占的显存，选择适合自己的，比如我的显卡内存是8g显存，我选择的模型就是Qwen2-7B-Instruct GPTQ-Int4

2、准备Modelfile文件

（1）Modelfile参数说明

命令	描述
`FROM` (必需的)	引入使用的模型或者模型源文件

新建一个txt文件，改名成modelfile，去掉扩展名。在里面贴上这么一句

FROM ./Qwen2-7B-Instruct GPTQ-Int4

新建一个文件夹叫qwenmodel，把模型和modelfile都放进去

（2）执行命令

ollama create qwen2 -f Modelfile

等待差不多10分钟，出现success表示成功。

3.运行安装qwen2模型

进到cmd命令下面。

输入“cd d:/qwenmodel”

进入这个目录下面，然后在这个目录下，开始运行ollama安装

输入命令“ollama run qwenmodel”

输入ollama list查看大模型列表

输入ollama run 模型名称我这里装了两个，直接运行启动一个就行，ollama run+模型名称就从服务器端，把大模型启动起来了。这里犯了错，搞了好久才明白，如果下次开机还行用模型，直接在cmd命令页面下，使用命令“ollama run 模型名”就可以启动了，跟tomcat启动一个道理。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2122138.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【第27章】Spring Cloud之适配Sentinel

【第27章】Spring Cloud之适配Sentinel

文章目录前言一、准备1. 引入依赖2. 配置控制台信息二、定义资源1. Controller2. Service3. ServiceImpl 三、访问控制台1. 发起请求2. 访问控制台总结前言 Spring Cloud Alibaba 默认为 Sentinel 整合了 Servlet、RestTemplate、FeignClient 和 Spring WebFlux。Sentinel…

阅读更多...

光伏电站的工程量造价怎么算的

光伏电站的工程量造价怎么算的

光伏电站的工程量造价怎么算的光伏电站的工程量造价是一个复杂且多变的过程，受多种因素影响，包括项目规模、设备选型、施工条件、地区差异、原材料价格波动等。以下是对光伏电站工程量造价的详细分析： 造价的构成： 设备的费用&…

阅读更多...

分享人工智能训练师不同级别对应职位和薪酬

分享人工智能训练师不同级别对应职位和薪酬

2024年4月，九部委联合发文《加快数字人才培育支撑数字经济发展行动方案（2024—2026年）》的通知（以下简称“通知”）。重点将人工智能领域人才培养放在首位，可见人工智能训练师作为连接技术与应用的桥梁…

阅读更多...

信息熵+互信息(信息增益)

信息熵+互信息(信息增益)

文章目录信息增益信息量信息熵条件熵信息增益交叉熵->信息熵->KL散度信息增益信息量信息奠基人香农（Shannon）认为“信息是用来消除随机不确定性的东西”，也就是说衡量信息量的大小就是看这个信息消除不确定性的程度。 “太阳从…

阅读更多...

代码随想录27期|Python|Day51|动态规划|115.不同的子序列|583. 两个字符串的删除操作|

代码随想录27期|Python|Day51|动态规划|115.不同的子序列|583. 两个字符串的删除操作|

115. 不同的子序列本题是在原来匹配子序列的基础上增加了统计所匹配的子序列个数，也就是dp数组的定义和更新公式和原来的有所区别。 1、dp数组的定义 dp[i][j]表示以i-1和j-1为末尾的字符串中，给定字符串s包含目标字符串t的个数。注意这里不是长度。…

阅读更多...

JMeter做接口测试，如何提取登录Cookie

JMeter做接口测试，如何提取登录Cookie

用JMeter进行接口测试时，经常需要通过登录接口提取Cookie才能进行其他业务流程，如果cookie/token是在登录请求的响应报文里，那么可以通过正则表达式直接提取出来，但是如果Cookie不是在响应报文里，还可以怎么提取出来呢…

阅读更多...

牛客小白月赛100（下）

牛客小白月赛100（下）

ACM中的C题题目描述登录—专业IT笔试面试备考平台_牛客网运行代码 #include<iostream> using namespace std; int main() {int n;cin>>n;if(n1)cout<<-1;else if(n%20)cout<<n/2;elsecout<<n/21; } 代码思路一、总体思路这段代码的目…

阅读更多...

第二百二十一节 JPA教程 - JPA按ID查找示例

第二百二十一节 JPA教程 - JPA按ID查找示例

JPA教程 - JPA按ID查找示例一旦我们将实体保存到数据库中，我们可以通过使用EntityManager中的find方法来检索它们。以下代码显示如何使用find方法与实体id。 Person emp em.find(Person.class, 1L);例子下面的代码来自Person.java。 package cn.w3cschool.…

阅读更多...

Spring Boot 部署方案！打包 + Shell 脚本详解

Spring Boot 部署方案！打包 + Shell 脚本详解

本篇和大家分享的是springboot打包并结合shell脚本命令部署，重点在分享一个shell程序启动工具，希望能便利工作； profiles指定不同环境的配置 maven-assembly-plugin打发布压缩包分享shenniu_publish.sh程序启动工具 linux上使用shenniu_p…

阅读更多...

Telephony VOLTE配置

Telephony VOLTE配置

1、展锐 VOLTE配置在配置运营商VOLTE业务时，虽然上层Carrierconfig默认配置VOLTE为关闭状态，但是发现只需要Modem侧配置为支持，上层就能够正常显示VOLTE开关。因此调查了一下相关逻辑相关代码中可以看到只要"gsm.sys.sim.volte.allowe…

阅读更多...

Enscape 4.1.0.2321 安装教程

Enscape 4.1.0.2321 安装教程

软件介绍 Enscape 是专门为建筑、规划、景观及室内设计师打造的渲染产品，无需导入导出文件，在常用的软件内部即可看到逼真的渲染效果。你无需了解记忆各种参数的用法，一切都是傻瓜式的一键渲染，你可以把精力更多地投入到设计中…

阅读更多...

极限编程XP例题

极限编程XP例题

答案：D 解析： 结对编程，一个人写代码，一个人看，由于是两个或两个以上的人负责，因此选项A 支持共同代码拥有和共同对系统负责是正确的选项B 由于是一个人写一个人看，变相实现了代码审查选项…

阅读更多...

AI基础 L16 Logic Agents I

AI基础 L16 Logic Agents I

What is an Agent? • The main point about agents is they are autonomous: capable of acting independently, exhibiting control over their internal state • Thus: an agent is a computer system capable of autonomous action in some environment in order to mee…

阅读更多...

网络编程（TCP通信）

网络编程（TCP通信）

【1】认识网络网络：多设备通信【2】IP地址 1.基本概念 IP地址是Internet中主机的标识Internet中的主机要与别的机器通信必须具有一个IP地址IP地址为32位（IPv4）或者128位（IPv6） NAT：公网转私网、私网转公网…

阅读更多...

小样本目标定位：Few-shot Object Localization

小样本目标定位：Few-shot Object Localization

论文：Few-shot Object Localization 代码：https://github.com/Ryh1218/FSOL 核心贡献： 1. 本文首次定义了小样本目标定位任务，为在标注数据有限的场景下进行目标定位提出了新的研究方向，并建立了高性能的基准。2. 提…

阅读更多...

【详解！】什么是端点安全，端点安全策略如何设置？30秒带你了解端点安全！

【详解！】什么是端点安全，端点安全策略如何设置？30秒带你了解端点安全！

端点，即接入网络的任何设备，如个人电脑、笔记本电脑、智能手机、平板电脑、服务器以及物联网(IoT)设备等，都是网络安全的潜在风险点。端点安全，正是针对这些设备所采取的一系列安全措施，旨在保护它们免受恶意软件、未…

阅读更多...

CSS【详解】图片相关样式（含object-fit ，object-position，lip-path，filter）

CSS【详解】图片相关样式（含object-fit ，object-position，lip-path，filter）

img 渲染图片，可以理解为一张镂空的白纸，通过镂空区域看到白纸下的图片。图片尺寸即镂空区域的大小若未指定，则按图片原始尺寸显示；若指定，则默认按指定尺寸显示（若指定尺寸的宽高比与原始的宽高比不同…

阅读更多...

【虚拟化】KVM-virsh离线工具进行客户机虚拟机磁盘访问

【虚拟化】KVM-virsh离线工具进行客户机虚拟机磁盘访问

目录一、简介二、常用离线命令三、具体使用实例 1.virt-inspector 2.virt-cat 3.virt-edit 4.virt-df 5.virt-copy-out/virt-copy-in 6.guestmount 7.virt-diff 8.virt-customize 9.virt-sparsify 一、简介 Red Hat Enterprise Linux 7 提供多个 libguestfs 工具…

阅读更多...

Leetcode 最长连续序列

Leetcode 最长连续序列

算法流程： 哈希集合去重： 通过将数组中的所有元素放入 unordered_set，自动去除重复元素。集合的查找操作是 O(1)，这为后续的快速查找提供了保证。遍历数组： 遍历数组中的每一个元素。对于每个元素，首先检…

阅读更多...

OpenCV 与 YoloV3的结合使用：目标实时跟踪

OpenCV 与 YoloV3的结合使用：目标实时跟踪

目录代码分析 1. YOLO 模型加载 2. 视频加载与初始化 3. 视频帧处理 4. 物体检测 5. 处理检测结果 6. 边界框和类别显示 7. 帧率（FPS）计算 8. 结果显示与退出 9. 资源释放整体代码效果展示总结代码分析这段代码使用 YOLO&#xff08…

阅读更多...

推荐文章

最新文章