人工智能|本地部署|ollama+chatbox快速Windows10下部署(初级篇)

news2025/2/6 17:13:27

一、

前言:

其实早一个月我已经使用过deepseek,并且也在自己的机器上通过ollama部署过,但一直没有太多动力,现在感觉还是的记录一下,省的自己给忘掉了

本文只是简单记录一下ollama+open-webui+chatbox部署通过网盘分享的文件:DeepSeek-R1-Distill-Qwen-32B-Q3_K_M.gguf
链接: https://pan.baidu.com/s/1aQ0FqspQIKk0eq2IoeCCiw?pwd=4xtk 提取码: 4xtk 
--来自百度网盘超级会员v6的分享这个模型

二、

环境要求

至少是Windows10, 内存至少16G,本人是32G,cpu至少13代,建议硬件资源越高越好,推理速度会好很多,体验不至于太差

至于其它的东西,比如python环境,cuda环境,cudnn等等这些通通不需要

当然了,显卡如果比较好的话,那自然是好事一件,如果比较差,这个也无所谓,关键是内存和cpu,我的机器经常把内存打满,有时候就比较无语

三。

ollama安装包和chatbox安装包

通过网盘分享的文件:OllamaSetup.exe
链接: https://pan.baidu.com/s/1DluxyKi_onBsLvWCUTspbA?pwd=1v65 提取码: 1v65 
通过网盘分享的文件:Chatbox.exe
链接: https://pan.baidu.com/s/1MTGTiB5rII5dBhgsY2x87g?pwd=sqq5 提取码: sqq5 

大模型文件:

链接:https://pan.baidu.com/s/1aQ0FqspQIKk0eq2IoeCCiw?pwd=4xtk 提取码:4xtk 

ollama在Windows下安装非常方便,就不在这过多废话了,同样的,chatbox也是一样,无脑安装就完事,如果安装不了,那么只能说以后不要碰电脑了,这些东西你把握不了

🆗,一般ollama安装完毕后,就有环境变量了,可以直接在cmd里运行

下面就开始一般步骤了:

1、

ollama导入大模型

先新建一个随意的文本文件,该文件是配置文件,名字无所谓,内容如下:

# Modelfile
FROM G:\software\DeepSeek-R1-Distill-Qwen-32B-Q3_K_M.gguf
PARAMETER num_ctx 4096
PARAMETER temperature 0.8
SYSTEM """你是一个擅长中文对话的AI助手,回答需简洁专业。"""

然后打开cmd,假设我的配置文件名字Modelfile.txt,那么,命令为:

ollama create test2 -f G:\software\Modelfile.txt

这里,我定义该自定义模型名称为test2,前面的DeepSeek-R1-Distill-Qwen-32B-Q3_K_M.gguf 将会复制到C:\Users\Administrator\.ollama\models 这个目录下

🆗,这样就轻松导入了,大概等待几分钟的样子,这个时候还需要run一下,run完后,也同时作为服务发布到了本地也就是127.0.0.1:11434 这个端口了,此时,ollama serve 命令不可执行,会报错


🆗,此时chatbox就可以派上用场了,由于两者是安装在一个机器上的,因此,很轻易的就可以配置使用了

这里看着对话很多,但都没有什么卵用,可以删除掉,点。。。编辑就可以删除掉

有很多,选择OLLAMA API就行

前面定义的是test:v1 并且run 过了,因此,可以在这里看到,如果run的有很多模型,下拉可以看到

然后保存就完事了,就已经可以体验了,如果遇到报错,重启就行了:

============================================================

推理的时候主要是用cpu和内存,gpu用的很少 ,推理速度和官网速度差不多,但质量方面来说一言难尽,毕竟gguf文件是裁剪过的大模型,可能会有很多错误。

我的显卡是4060Ti,8g内存,完全够跑这个模型

下次在说说如何使用nginx+open-webui 发布大模型服务

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2293882.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android Studio 下载安装教程(2024 更新版),附详细图文

今天,为大家带来的是Android Studio 2024更新版的下载安装教程,包含详细图文步骤。 随着 Android Studio 的不断更新,自从引入 Koala 系列后,其版本号的命名规则也发生了变化。以本次更新为例,版本号为 2024.2.1&#…

6.【BUUCTF】[SUCTF 2019]CheckIn

打开题目页面如下 看样子是一道有关文件上传的题 上传一句话木马 显示:非法后缀! 看来.php后缀被过滤了 上传一张带有木马的照片 在文件地址处输入cmd 输入以下代码执行 copy 1.jpg/b4.php/a 5.jpg 最后一行有一句话木马 上传带有木马的图片 但其实…

在线教程丨YOLO系列10年更新11个版本,最新模型在目标检测多项任务中达SOTA

YOLO (You Only Look Once) 是计算机视觉领域中最具影响力的实时目标检测算法之一,以其高精度与高效性深受业界青睐,广泛应用于自动驾驶、安防监控、医疗影像等领域。 该模型最早于 2015 年由华盛顿大学研究生 Joseph Redmon 发布,开创了将目…

FreeRTOS学习 --- 中断管理

什么是中断? 让CPU打断正常运行的程序,转而去处理紧急的事件(程序),就叫中断 中断执行机制,可简单概括为三步: 1,中断请求 外设产生中断请求(GPIO外部中断、定时器中断…

Docker基础以及单体实战

Docker 一、Docker1.1 Docker组成1.2 Dcoker运行图1.3 名称空间Namepace 1.4 docker、Docker compose、kubermetes 二、Docker安装2.1 在线Docker安装2.2 使用官方通用安装脚本2.3 二进制安装Docker三、Docker基础命令3.1 启动类3.2 镜像类3.3 容器类3.4 网络类3.5 Docker comp…

FFmpeg rtmp推流直播

文章目录 rtmp协议RTMP协议组成RTMP的握手过程RTMP流的创建RTMP消息格式Chunking(Message 分块) rtmp服务器搭建Nginx服务器配置Nginx服务器 librtmp库编译推流 rtmp协议 RTMP(Real Time Messaging Protocol)是由Adobe公司基于Flash Player播放器对应的…

2025Java面试题超详细整理《微服务篇》

什么是微服务架构? 微服务框架是将某个应用程序开发划分为许多独立小型服务,实现敏捷开发和部署,这些服务一般围绕业务规则进行构建,可以用不同的语言开发,使用不同的数据存储,最终使得每个服务运行在自己…

IIC重难点-2

一、光环境传感器硬件原理图 二、i.MX6ull I2C控制器介绍 1. Inter IC (I2C)提供标准I2C从机和主机的功能。I2C被设计为兼容标准NXP I2C总线协议。 2. I2C是一种双线双向串行总线,它提供了一种简单有效的数据交换方法,最大限度地减少了…

优化数据库结构

MySQL学习大纲 一个好的数据库设计方案对于数据库的性能尝尝会起到事倍功半的效果,合理的数据库结构不仅使数据库占用更小的磁盘空间,而且使查询速度更快。数据库结构的设计需要考虑数据冗余、查询和更新速度、字段的数据类型是否合理等多方面的内容&…

2. K8S集群架构及主机准备

本次集群部署主机分布K8S集群主机配置主机静态IP设置主机名解析ipvs管理工具安装及模块加载主机系统升级主机间免密登录配置主机基础配置完后最好做个快照备份 2台负载均衡器 Haproxy高可用keepalived3台k8s master节点5台工作节点(至少2及以上)本次集群部署主机分布 K8S集群主…

51单片机07 串口通信

串口是一种应用十分广泛的通讯接口,串口成本低、容易使用、通信线路简单,可实现两个设备的互相通信。单片机的串口可以使单片机与单片机、单片机与电脑、单片机与各式各样的模块互相通信。51单片机内部自带UART(Universal Asynchronous Recei…

Java进阶——IO 流

文章目录 Java进阶——IO 流 1、File 类的使用 1.1、File 常用构造器1.2、路径分隔符1.3、File 的常用方法 2、IO流原理及流的分类 2.1、IO流原理2.2、流的分类 3、IO流的体系结构4、节点流 4.1、FileReader 读入数据的操作4.2、FileWriter 写出数据的操作4.3、FileReader 和 …

搭建集成开发环境PyCharm

1.下载安装Python(建议下载并安装3.9.x) https://www.python.org/downloads/windows/ 要注意勾选“Add Python 3.9 to PATH”复选框,表示将Python的路径增加到环境变量中 2.安装集成开发环境Pycharm http://www.jetbrains.com/pycharm/…

国防科大:双目标优化防止LLM灾难性遗忘

📖标题:How to Complete Domain Tuning while Keeping General Ability in LLM: Adaptive Layer-wise and Element-wise Regularization 🌐来源:arXiv, 2501.13669 🌟摘要 🔸大型语言模型(LLM…

NacosRce到docker逃逸实战

NacosRce到docker逃逸实战 1、Nacos Derby Rce打入内存马 这个漏洞的原理大家应该都知道&#xff0c; 2.3.2 < Nacos < 2.4.0版本默认derby接口未授权访问&#xff0c;攻击者可利用未授权访问执行SQL语句加载构造恶意的JAR包导致出现远程代码执行漏洞。 在日常的漏洞挖…

在Vue3 + Vite 项目中使用 Tailwind CSS 4.0

文章目录 首先是我的package.json根据官网步骤VS Code安装插件验证是否引入成功参考资料 首先是我的package.json {"name": "aplumweb","private": true,"version": "0.0.0","type": "module","s…

扣子平台的选择器节点:让智能体开发更简单,扣子免费系列教程(17)

欢迎来到涛涛聊AI。今天&#xff0c;我们来聊聊一个非常实用的工具——扣子平台的选择器节点。即使你不是计算机专业人员&#xff0c;但对计算机操作比较熟悉&#xff0c;这篇文章也能帮你快速上手。我们会从基础知识讲起&#xff0c;一步步带你了解选择器节点的使用方法和应用…

享元模式——C++实现

目录 1. 享元模式简介 2. 代码示例 1. 享元模式简介 享元模式是一种结构型模式。 享元模式用于缓存共享对象&#xff0c;降低内存消耗。共享对象相同的部分&#xff0c;避免创建大量相同的对象&#xff0c;减少内存占用。 享元模式需要将对象分成内部状态和外部状态两个部分…

SSRF 漏洞利用 Redis 实战全解析:原理、攻击与防范

目录 前言 SSRF 漏洞深度剖析 Redis&#xff1a;强大的内存数据库 Redis 产生漏洞的原因 SSRF 漏洞利用 Redis 实战步骤 准备环境 下载安装 Redis 配置漏洞环境 启动 Redis 攻击机远程连接 Redis 利用 Redis 写 Webshell 防范措施 前言 在网络安全领域&#xff0…

react的antd表格自定义图标

将原版的加号换成箭头 自定义图标 安装图标包&#xff1a; npm install --save ant-design/icons 引入&#xff1a; import { RightOutlined, DownOutlined } from ant-design/icons; 参数是一个函数 <Table columns{columns} dataSource{data} indentSize{20}expandIc…