实习日志2之windows上大模型(qwen2-7b)部署

news2024/9/9 0:15:48

一、模型部署

1、下载ollama(大模型本地部署工具),并安装

下载网址:https://ollama.com/

ollama是大模型部署方案,对应docker,本质也是基于docker的容器化技术。

2、下载大模型

在命令框,如windows系统在cmd窗口输入命令

ollama run [model name]

模型名称可以去ollama官网搜索,一般来说7b需要8G内存,13b需要16GB的内存,70b需要64GB的内存

至此就可以在命令框和大模型进行交互,但是这种方式太远古了

我们可以使用一个图形化的界面进行操作,可以使用Open WebUI

3、其他

在与模型交互在过程中的命令

结束对话:a. Ctrl+D

Ollama的两种模式

1、聊天模式:对话模式和查询模式

对话模式:大模型会根据给的文档和已有的知识储备综合起来回答问题

查询模式:大模型只是根据文档进行回答

2、服务器模式:让ollama后端去运行大模型,然后它会开放一个端口给到所有的软件,这些软件通过这个端口就能去调用这些大模型的能力

开启服务器模式:在终端里输入 ollama serve

二、图形化界面部署

要安装Open WebUI 需要先安装docker

docker官网:docker-toolbox-windows-docker-for-windows安装包下载_开源镜像站-阿里云

安装注意事项:

直接执行exe文件会出现如下错误:

问题在于,docker desktop部署在windows上运行docker服务是基于windows的Hyper-V服务和WSL2内核的Windows上创建一个子系统(Linux),所以电脑上需要开启Hyper-V服务,并且安装WSL2(Windows下的Linux子系统)。

WSL 是 Windows Subsystem for Linux 的缩写,它是 Windows 10 操作系统的一项功能,使你能够在 Windows 上直接运行 Linux 文件系统,以及 Linux 命令行工具和 GUI 应用程序,并与传统的 Windows 桌面和应用程序一起运行。

  • 需要启动 Windows Hyper-V 和容器特性

直接搜索 启动或关闭Windows功能,勾选Hyper-V相关的功能

如果没有Hyper-V这个选项,需要新建一个文件命名为Hyper.cmd,文件中输入以下内容: 然后以管理员身份运行,之后重启电脑就可,window专业版自带Hyper这个功能

pushd "%~dp0"
dir /b %SystemRoot%\servicing\Packages\*Hyper-V*.mum >hyper-v.txt
for /f %%i in ('findstr /i . hyper-v.txt 2^>nul') do dism /online /norestart /add-package:"%SystemRoot%\servicing\Packages\%%i"
del hyper-v.txt
Dism /online /enable-feature /featurename:Microsoft-Hyper-V-All /LimitAccess /ALL

安装wsl,在命令行(以管理员身份运行)执行

wsl --update

wsl --install

一定要确保电脑已经开启了虚拟化

docker类似于一个虚拟的容器,它会把所有需要的依赖、资源全部打包在这个容器里,然后再放到系统上去运行。需要执行如下命令

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

会弹出如下web UI的界面,如果没有,可以尝试在地址栏输入loaclhost:3000

webUI除了包含基本的聊天功能外,还包含RAG能力,无论是网页还是文档都可以作为参考资料给到大模型

如果希望谷大模型读取网页,需要在链接前面加#号

可以点击+号上传文档

在对话框中输入#可以出现导入的文档

三、Anything LLM(搭建知识库)

启动ollama服务器模式,将ollama base url对应的链接镰刀Anything LLM软件里

这个时候软件就会通过链接读取可以加载的模型,这些模型都是用来生成内容的模型

下载地址:Download AnythingLLM for Desktop

第一步:选择模型,可以是商用大模型也可以是本地模型,这里选ollama

第二步:选嵌入模型,这里选默认AnythingLLM Embedder

第三步:选向量数据库,这里选默认lanceDB

第四步:输入workspace的名字,workspace就是将不同的知识库分隔成一个个工作区,可以点击上传按钮,上传文档、网页等

两个关键

1、嵌入模型

把上传的文本,表格数据处理成数字形式的一种低维嵌入向量数据,就是负责把高维度的数据转化为低维度的嵌入空间,这个数据处理的过程在RAG中非常重要

2、向量式数据库

专门用来高效处理大规模的向量数据

四、外部访问

1、安装ngrok(内网穿透工具)

给open WebUI 生成一个可以访问的地址,允许在外网的情况下能够访问

打开cmd,以管理员身份运行

choco install ngrok choco -v

注意:

如果执行choco install ngrok报错,说明电脑上还没有安装此工具

需要先执行如下命令安装

Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))

执行choco,出现如下代表安装成功

2、获取身份令牌

登录ngrok官网,选择Your Authtoken

粘贴认证令牌,复制到终端

3、指定外部需要访问的端口

ngrok http http://localhost:3000

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1958265.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

汽车、能源、烟草、电力行业洞见:TDengine 用户大会亮点荟萃

近年来,随着物联网、车联网、工业互联网等前沿技术的迅猛发展,全球数据量呈指数级增长。作为大数据的一个重要组成部分,时序数据因其在实时监控、预测分析和智能决策中的独特优势,正逐步成为数字化转型的关键要素。尤其在 AI 时代…

如何使用Firefox浏览器连接IPXProxy设置海外代理IP教程

​Firefox浏览器是大家上网时经常会使用的一款工具。不过,有时候我们会遇到一些网站无法直接访问的情况。这时候,通过海外代理IP,比如像IPXProxy代理这样的服务,可能就能帮助我们进入那些受限制的网站,获取我们所需的资…

如何通过 CloudCanal 实现从 Kafka 到 AutoMQ 的数据迁移

01 引言 随着大数据技术的飞速发展,Apache Kafka 作为一种高吞吐量、低延迟的分布式消息系统,已经成为企业实时数据处理的核心组件。然而,随着业务的扩展和技术的发展,企业面临着不断增加的存储成本和运维复杂性问题。为了更好地…

Discourse 如何通过终端工具访问 PGSQL

PGSQL 在 Discourse 中是通过容器方式运行的,要访问 PGSQL 中的数据那么首先需要进入到容器后才可以。 进入容器的命令为: cd /var/discourse/./launcher enter appsu discoursepsql discourse最后的命令是登录到运行在容器中的 pgsql。 查看 pgsql 上…

CTFshow--Web--代码审计

目录 web301 web302 web303 web304 web305 web306 web307 web308 web309 web310 web301 开始一个登录框, 下意识sql尝试一下 发现 1 的时候会到一个 checklogin.php 的路径下, 但啥也没有 好吧, 这是要审计代码的 ,下载好源码, 开始审计 看了一下源码 , 应该就是sql…

thinkPHP开发的彩漂网站源码,含pc端和手机端

源码简介 后台thinkPHP架构,页面程序双分离,Mysql数据库严谨数据结构、多重数据审核机制、出票机制和监控机制,html5前端技术适用移动端,后台逻辑更多以server接口可快捷实现对接pc和ap,下载会有少量图片素材丢失,附件有下载说明前端demo账户密码和后台管理地址管理员账户密码…

c++修炼之路之二叉搜索树

目录 前言 一:二叉搜索树的介绍 二:二叉搜索树的实现 1.查找 2.insert(插入) 3.erase(删除) 4.析构函数 5.拷贝构造 6.赋值重载 7.插入,删除,查找的递归版本 三:二叉搜索树的应用 四:二叉搜索…

精灵图的使用——网页制作技巧

把许多小图标集中在一张背景透明的图片上,这种图片叫做精灵图,如下图。 在线工具地址:http://www.spritecow.com/ 通过工具可以快速找到图标在精灵图上的坐标位置。 首先,我们打开工具地址,点击第一个按钮。 点击后&am…

LeetCode 算法:搜索二维矩阵 c++

原题链接🔗:搜索二维矩阵 难度:中等⭐️⭐️ 题目 给你一个满足下述两条属性的 m x n 整数矩阵: 每行中的整数从左到右按非严格递增顺序排列。每行的第一个整数大于前一行的最后一个整数。给你一个整数 target ,如果…

实战:ZooKeeper 操作命令和集群部署

ZooKeeper 操作命令 ZooKeeper的操作命令主要用于对ZooKeeper服务中的节点进行创建、查看、修改和删除等操作。以下是一些常用的ZooKeeper操作命令及其说明: 一、启动与连接 启动ZooKeeper服务器: ./zkServer.sh start这个命令用于启动ZooKeeper服务器…

手搓排序算法:插入排序、选择排序

文章目录 插入排序直接插入排序希尔排序内层循环时间复杂度计算 选择排序直接选择排序优化 堆排序 插入排序 直接插入排序 时间复杂度最差:大的数据都在左边,小的数据在右边,随着有序区间增大,交换次数增多 时间复杂度最优&…

C#知识|文本文件操作:删除、复制、移动文件的操作

哈喽,你好啊,我是雷工! 接下来学习文件的删除和复制,实际应用场景,当软件具有自动在线更新功能时,需要先检测服务器是否具有更新版本的安装包,如果有的话需要将其复制到本地进行升级安装,如果有勾选自动清理安装包功能的话,还可以将安装包删除。 01 删除文件 实现功能…

使用MultipartFile来上传单个及多个文件代码示例(前端传参数及后端接收)

背景 前端使用vue或vue+vant上传文件 后端java接收MultipartFile和其他参数 一、MultipartFile上传单个文件代码示例 1.1 MultipartFile上传单个文件,不包含其它参数 1.1.1 控制层代码如下: /*** 1、上传单个文件,不包含其它参数* */ @PostMapping( "/upload")…

docker 建木 发版 (详细教程)

先创建git仓库 Git勤勉 两种方式上传-CSDN博客 把项目送上去 进入建木 可以接着这个来 dockerfile部署镜像 ->push仓库 ->虚拟机安装建木 ->自动部署化 (详细步骤)-CSDN博客 创建分组项目 开始操作 git 上钩子 前面链接里有这个教…

MobaXterm tmux 配置妥当

一、事出有因 缘由:接上篇文章,用Docker搭建pwn环境后,用之前学过的多窗口tmux进行调试程序,但是鼠标滚动的效果不按预期上下翻屏。全网搜索很难找到有效解决办法,最后还是找到了一篇英文文章,解决了&…

upload-labs靶场练习

文件上传函数的常见函数: 在PHP中,‌文件上传涉及的主要函数包括move_uploaded_file(), is_uploaded_file(), get_file_extension(), 和 mkdir()。‌这些函数共同协作,‌使得用户可以通过HTTP POST方法上传文件,‌并在服务器上保存…

浅谈C语言整型类数据在内存中的存储

1、整型类数据 C语言中的整型类数据都归类在整型家族中,其中包括:char、short、int、long、long long这5个大类,而每个大类中又分为两类signed和unsigned,这些都是C语言中的内置类型。以下重点基于char和int这两种类型的数据进行阐述&#x…

妈吖,看过这个大厂的oracle主键自增,我的信心暴增!信创,国产数据库也能行。

创作不易 只因热爱!! 热衷分享,一起成长! “你的鼓励就是我努力付出的动力” 1.数据库oracle自增主键字段思维导图 在Oracle数据库中,可以通过创建序列(SEQUENCE)来实现自增功能。但也可以不在数据库中实现,而是通过程…

Sequential的使用

卷积前后尺寸不变的 Padding值计算: padding (卷积核尺寸-1)/2 Sequential 可以简化代码: def __init__(self):super(Tudui, self).__init__()self.model1 Sequential(Conv2d(3, 32, 5, padding2),MaxPool2d(2),Conv2d(32, 32…

ctfshow web入门 CMS web477--web479

web477 CMSEazy5.7 不让扫&#xff0c;那就尝试一下admin路由&#xff0c;成功了 admin登录进入后台 也看到了其实 首页可以看到提示 然后去自定义标签打 1111111111";}<?php phpinfo()?>刷新一下预览即可 11";}<?php assert($_POST[g]);?>也可…