大模型本地化部署(Ollama + Open-WebUI)

news2025/2/1 17:15:45

文章目录

  • 环境准备
    • 下载Ollama
    • 模型下载
    • 下载Open-WebUI
  • 本地化部署的Web图形化界面
  • 本地模型联网查询
    • 安装 Docker
    • 安装 SearXNG
    • 本地模型联网查询

环境准备

下载Ollama

  下载地址:Ollama网址

  安装完成后,命令行里执行命令

ollama -v

查看是否安装成功。安装成功会显示版本信息

在这里插入图片描述

ollama 的命令可通过 ollama -h 查看。

模型下载

  可以在 Ollama 网站的 Models 里查看公开的大模型(网址),也可以从大模型镜像源站 HF-Mirror 下载。

  以 Ollama 网站为例,点进一个大模型(如最近大火的 DeepSeek R1)

在这里插入图片描述

如图右下角的 ollama run deepseek-r1 就是下载命令,在第一次执行该命令时,ollama 将从网站下载大模型,在下载完成后,再执行这一命令就会加载模型,并进入交互模式:

在这里插入图片描述

:大部分模型都是有内容审查的,这很多时候限制了我们的使用灵活性,可以寻找带有 abliterated 后缀的模型,这些模型被注释了审查代码。(不过本人尝试发现 abliterated 版本的实际上仍存在审查机制,会拒绝回答某些问题)

下载Open-WebUI

  网上其他教程安装 Open-WebUI 一般都是在虚拟机 Docker 下安装的,这在 Windows 系统里很不方便。这里提供另外一种方法:首先安装 Python 3.11,然后在命令行里执行

pip install open-webui

即可完成 open-webui 的安装。

本地化部署的Web图形化界面

  首先,需要开启 Ollama 服务,运行一个大模型,在命令行里执行

ollama run 大模型名

其中模型名可以通过 ollama list 查看。启用 ollama 服务后,可以使用

ollama ps

命令查看当前运行的模型进程。

  随后再打开一个命令行,执行如下命令启用 open-webui 服务

open-webui serve

启动后可以在浏览器里输入以下地址,打开 Web 图形化界面:

localhost:8080
(本机IP):8080

其中第二个地址可以在局域网内的其他设备访问

  Open-WebUI 的界面如下

在这里插入图片描述

本地化部署完成!

本地模型联网查询

  未联网的情况下,很多问题大模型无法解决,回答也比较蠢(还会胡说),因此需要增加联网查询功能。

安装 Docker

  安装 Docker Desktop 即可(网址 Docker)。安装后用以下命令查询是否安装完成:

docker -v

安装 SearXNG

  执行如下命令拉取 SearXNG (一个可以本地部署的轻量化搜索引擎)

docker pull searxng/searxng

不过这个命令由于网站无法连接,下载往往失败,可以使用镜像源:

docker pull docker.m.daocloud.io/searxng/searxng

安装完成后即可在 Docker Desktop 里查看到 SearXNG Image:

在这里插入图片描述

  执行如下命令(最后面一串是 Image Name,注意要和你的 SearXNG 名字相同),将服务开在了端口 12345

docker run -d -p 12345:8080 docker.m.daocloud.io/searxng/searxng

随后可以在 Docker Desktop 的 Container/App 界面查看到运行的 SearXNG,显示运行在 12345 号端口。在命令行里使用

docker ps

命令也可以查看到运行中的 docker 镜像进程。

  在浏览器访问 localhost:12345,可以看到 SearXNG 服务已开启。

在这里插入图片描述

用默认配置的 SearXNG 很可能搜索不到东西,可以在配置里修改搜索引擎,改成大陆可以访问的那几个。

本地模型联网查询

  在 open-webui 界面下,用户->管理员面板->设置 里面,配置搜索引擎如下,并保存设置

在这里插入图片描述

此时询问问题,联网查询可能会报 403 错误,需要修改一个配置文件。执行

docker ps

查看 searxng 服务的 CONTAINER ID 号,随后执行以下命令(命令中的 <CONTAINER_ID> 替换为你 SearXNG 的 CONTAINER ID)

docker exec -it <CONTAINER_ID> sh

进入到镜像目录,随后进入 /etc/searxng/ 目录,使用 vi 修改 settings.yml 文件,在 formats 下面增加一行(- json)

在这里插入图片描述

修改文件后保存,然后 restart 容器。


  修改 settings.yml 后,open-webui 联网查询不再报 403 错误,但可能报 Expecting value: line 1 column 1 (char 0) 错误(这是因为返回值格式不满足 json 格式导致的解析错误)或 RemoteDisconnected('Remote end closed connection without response') 错误,笔者目前还没有找到好的解决方法,日后若解决了再补上这里。

(U•ェ•*U )

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2289388.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux系统】进程间通信:共享内存

认识共享内存 通过 一些系统调用&#xff0c;在物理内存中开辟一块空间&#xff0c;然后将该空间的起始地址&#xff0c;通过页表映射到两个进程的虚拟地址空间的共享区中&#xff0c;这样不就共享了一块空间吗&#xff01;&#xff01;&#xff01; 这种技术就是共享内存&am…

渗透测试之WAF组合条件绕过方式手法详解以及SQL注入参数污染绕过

目录 组合绕过waf ​先看一些语句 绕过方式 我给出的注入语句是&#xff1a; 这里要注意的几点是&#xff1a; 组合绕过方式 完整过狗注入语句集合 http请求分块传输方法 其它方式绕过 http参数污染绕过waf 面试题:如何参数污染绕过waf 可以通过http参数污染绕过wa…

oracl:多表查询>>表连接[内连接,外连接,交叉连接,自连接,自然连接,等值连接和不等值连接]

SQL&#xff08;Structured Query Language&#xff0c;结构化查询语言&#xff09;是一种用于管理和操作关系数据库的标准编程语言。 sql分类: 数据查询语言&#xff08;DQL - Data Query Language&#xff09; 查询的关键词 select 多表查询>>表连接 表连接: 把2个…

ARIMA详细介绍

ARIMA&#xff08;AutoRegressive Integrated Moving Average&#xff0c;自回归积分滑动平均模型&#xff09;是一种用于时间序列分析和预测的统计模型。它结合了自回归&#xff08;AR&#xff09;、差分&#xff08;I&#xff09;和移动平均&#xff08;MA&#xff09;三种方…

飞致云开源社区月度动态报告(2025年1月)

自2023年6月起&#xff0c;中国领先的开源软件公司飞致云以月度为单位发布《飞致云开源社区月度动态报告》&#xff0c;旨在向广大社区用户同步飞致云旗下系列开源软件的发展情况&#xff0c;以及当月主要的产品新版本发布、社区运营成果等相关信息。 飞致云开源运营数据概览&…

【搜索回溯算法篇】:拓宽算法视野--BFS如何解决拓扑排序问题

✨感谢您阅读本篇文章&#xff0c;文章内容是个人学习笔记的整理&#xff0c;如果哪里有误的话还请您指正噢✨ ✨ 个人主页&#xff1a;余辉zmh–CSDN博客 ✨ 文章所属专栏&#xff1a;搜索回溯算法篇–CSDN博客 文章目录 一.广度优先搜索&#xff08;BFS&#xff09;解决拓扑排…

WPS怎么使用latex公式?

1、下载并安装mathtype https://blog.csdn.net/weixin_43135178/article/details/125143654?sharetypeblogdetail&sharerId125143654&sharereferPC&sharesourceweixin_43135178&spm1011.2480.3001.8118 2、将mathtype嵌入在WPS MathType面板嵌入器,免费工具…

简单的爱心跳动表白网页(附源码)

一&#xff1a;准备工作 在开始之前&#xff0c;确保已经具备基础的 HTML、CSS 和 JavaScript 知识。同时&#xff0c;也要准备好一个代码编辑器&#xff0c;比如 VS Code 或 Sublime Text。接下来&#xff0c;我们需要创建三个文件&#xff1a;index.html、styles.css 和 scr…

【AI】DeepSeek 概念/影响/使用/部署

在大年三十那天&#xff0c;不知道你是否留意到&#xff0c;“deepseek”这个词出现在了各大热搜榜单上。这引起了我的关注&#xff0c;出于学习的兴趣&#xff0c;我深入研究了一番&#xff0c;才有了这篇文章的诞生。 概念 那么&#xff0c;什么是DeepSeek&#xff1f;首先百…

【4Day创客实践入门教程】Day3 实战演练——桌面迷你番茄钟

Day3 实战演练——桌面迷你番茄钟 目录 Day3 实战演练——桌面迷你番茄钟1. 选择、准备元件、收集资料2. 硬件搭建3.编写代码 Day0 创想启程——课程与项目预览Day1 工具箱构建——开发环境的构建Day2 探秘微控制器——单片机与MicroPython初步Day3 实战演练——桌面迷你番茄钟…

AndroidCompose Navigation导航精通1-基本页面导航与ViewPager

文章目录 前言基本页面导航库依赖导航核心部件简单NavHost实现ViewPagerPager切换逻辑图阐述Pager导航实战前言 在当今的移动应用开发中,导航是用户与应用交互的核心环节。随着 Android Compose 的兴起,它为开发者提供了一种全新的、声明式的方式来构建用户界面,同时也带来…

Node.js——body-parser、防盗链、路由模块化、express-generator应用生成器

个人简介 &#x1f440;个人主页&#xff1a; 前端杂货铺 &#x1f64b;‍♂️学习方向&#xff1a; 主攻前端方向&#xff0c;正逐渐往全干发展 &#x1f4c3;个人状态&#xff1a; 研发工程师&#xff0c;现效力于中国工业软件事业 &#x1f680;人生格言&#xff1a; 积跬步…

C语言指针专题四 -- 多级指针

目录 1. 多级指针的核心原理 1. 多级指针的定义 2. 内存结构示意图 3. 多级指针的用途 2. 编程实例 实例1&#xff1a;二级指针操作&#xff08;修改一级指针的值&#xff09; 实例2&#xff1a;动态二维数组&#xff08;二级指针&#xff09; 实例3&#xff1a;三级指…

深度学习的应用

目录 一、机器视觉 1.1 应用场景 1.2 常见的计算机视觉任务 1.2.1 图像分类 1.2.2 目标检测 1.2.3 图像分割 二、自然语言处理 三、推荐系统 3.1 常用的推荐系统算法实现方案 四、图像分类实验补充 4.1 CIFAR-100 数据集实验 实验代码 4.2 CIFAR-10 实验代码 深…

RabbitMQ 多种安装模式

文章目录 前言一、Windows 安装 RabbitMq1、版本关系2、Erlang2.1、下载安装 Erlang 23.12.2、配置 Erlang 环境变量 3、RabbitMQ3.1、下载安装 RabbitMQ 3.8.93.2、环境变量3.3、启动RabbitMQ 管理插件3.3、RabbitMQ3.4、注意事项 二、安装docker1、更新系统包&#xff1a;2、…

吴恩达深度学习——有效运作神经网络

内容来自https://www.bilibili.com/video/BV1FT4y1E74V&#xff0c;仅为本人学习所用。 文章目录 训练集、验证集、测试集偏差、方差正则化正则化参数为什么正则化可以减少过拟合Dropout正则化Inverted Dropout其他的正则化方法数据增广Early stopping 归一化梯度消失与梯度爆…

DDD - 微服务架构模型_领域驱动设计(DDD)分层架构 vs 整洁架构(洋葱架构) vs 六边形架构(端口-适配器架构)

文章目录 引言1. 概述2. 领域驱动设计&#xff08;DDD&#xff09;分层架构模型2.1 DDD的核心概念2.2 DDD架构分层解析 3. 整洁架构&#xff1a;洋葱架构与依赖倒置3.1 整洁架构的核心思想3.2 整洁架构的层次结构 4. 六边形架构&#xff1a;解耦核心业务与外部系统4.1 六边形架…

数据结构与算法之二叉树: LeetCode LCP 10. 二叉树任务调度 (Ts版)

二叉树任务调度 https://leetcode.cn/problems/er-cha-shu-ren-wu-diao-du/description/ 描述 任务调度优化是计算机性能优化的关键任务之一。在任务众多时&#xff0c;不同的调度策略可能会得到不同的总体执行时间&#xff0c;因此寻求一个最优的调度方案是非常有必要的 通…

玩转大语言模型——配置图数据库Neo4j(含apoc插件)并导入GraphRAG生成的知识图谱

系列文章目录 玩转大语言模型——使用langchain和Ollama本地部署大语言模型 玩转大语言模型——ollama导入huggingface下载的模型 玩转大语言模型——langchain调用ollama视觉多模态语言模型 玩转大语言模型——使用GraphRAGOllama构建知识图谱 玩转大语言模型——完美解决Gra…

计算机毕业设计Python+CNN卷积神经网络考研院校推荐系统 考研分数线预测 考研推荐系统 考研爬虫 考研大数据 Hadoop 大数据毕设 机器学习

温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 作者简介&#xff1a;Java领…