ubuntu本地部署llama3大模型

news2024/9/24 15:17:27

安装大模型

首先需要安装curl:

sudo apt install curl

然后安装 ollama,可以去ollama.com复制下载命令:

curl -fsSL https://ollama.com/install.sh | sh

在这里插入图片描述

然后就是启动ollama服务:

ollama serve

在这里插入图片描述

出现这个说明已经运行,然后需要修改ollama端口:

sudo nano /etc/systemd/system/ollama.service

在[service]最后面加上两行:

Environment=“OLLAMA_HOST=0.0.0.0”
Environment=“OLLAMA_ORIGINS=*”

在这里插入图片描述

ctrl+s保存,ctrl+x退出。用cat命令看一下:

cat /etc/systemd/system/ollama.service

ok,没问题的话。重新加载systemd守护进程并启用Ollama服务:

sudo systemctl daemon-reload
sudo systemctl restart ollama
sudo systemctl stop ollama #关闭服务
sudo systemctl start ollama #启动服务

运行llama8b大模型:

ollama run llama3:8b

等待下载完成:
在这里插入图片描述
试一试:
在这里插入图片描述

如果要装其他模型,可以在这里搜索:
在这里插入图片描述然后选下载量高的模型,点下载,复制对应指令运行即可:
在这里插入图片描述

安装 ChatBox

安装Web UI需要docker。这里直接安装ChatBox:
下载ubuntu版本,后缀是.AppImage。下载完了,进入下载的文件夹,打开终端,赋予文件执行权限

chmod +x Chatbox-1.3.15-x86_64.AppImage

直接运行

./Chatbox-1.3.15-x86_64.AppImage

在这里插入图片描述
点开始设置,然后模型选ollama,就可以看到下面的界面了:

在这里插入图片描述选择llama3:8b模型,点保存即可。

然后点新对话,或者just chat:
在这里插入图片描述

anythingLLM

chatBox我试了下,没有RAG,就相当于没有本地知识库,所以换anythingLLM。
可以在 anythingLLM官网 查看如何下载,这里使用非docker方式,命令行输入:

curl -fsSL https://s3.us-west-1.amazonaws.com/public.useanything.com/latest/installer.sh | sh

在这里插入图片描述安装完的APP位于$HOME/AnythingLLMDesktop,你可以通过脚本启动:

~/AnythingLLMDesktop/start

在这里插入图片描述然后get started,选ollama:
在这里插入图片描述
然后一路点 -> ,可能需要填一下邮箱,自己写一下工作区的名字,如我叫embeddedWorkSpace。其余设置可以在这个按钮上完成:
在这里插入图片描述新建一个文档,作为知识库:
在这里插入图片描述不导入文档进行测试:
在这里插入图片描述现在开始导入知识库:

在这里插入图片描述
在这里插入图片描述其中第三步是当你点完2后,会弹出一个按钮Move to Workspace,你点一下就会过去了:
在这里插入图片描述

再问一下试一试:

在这里插入图片描述

如果你需要修改比如使用什么向量数据库,你可以在这边配置:
在这里插入图片描述

接入QQ群

本来qq群打算用到go-cqhttp,不过看官方说接口被封死了,然后腾讯推出NTQQ可以用来弄:QQ机器人快速注册指南

首先要去注册好qq机器人,然后根据 git教程 安装qq机器人开发工具botpy:

pip install --upgrade pip #更新一下pip
sudo pip install qq-botpy
#sudo pip install qq-bot --upgrade #这个是SDK

下载botpy:

git clone https://github.com/tencent-connect/botpy

进入botpy文件夹,配置依赖

cd ./botpy
sudo pip install -r requirements.txt # 安装依赖的pip包
pre-commit install # 安装格式化代码的钩子

先确保安装了pytest:

sudo pip install pytest

然后可以运行测试案例了,报错:

.....
class CeilTimeout(async_timeout.timeout):
E   TypeError: function() argument 'code' must be code, not str

更新一下aiohttp:

sudo pip install --upgrade aiohttp

报错

....
ERROR: qq-bot 0.8.5 has requirement aiohttp<3.8.0,>=3.6.0, but you'll have aiohttp 3.9.5 which is incompatible.
Installing collected packages: async-timeout, aiohttp
....

版本太高了,这里我需要安装3.8以下版本,3.6及以上版本

sudo pip install “aiohttp<3.8.0”
sudo pip install “aiohttp>=3.6.0”

查看版本,确保版本没问题

pip freeze | grep aiohttp

参考

Llama3 中文Llama3 中文版本地环境搭建和部署实战ollama版
创造未来知识管理新篇章:Ollama与AnythingLLM联手打造个人与企业的安全知识库!
QQ机器人快速注册指南
Ubuntu系统下部署大语言模型:Ollama和OpenWebUI实现各大模型的人工智能自由
WSL安装使用Ollama
手把手教你快速部署Ollama与大模型
如何将 Chatbox 连接到远程 Ollama 服务:逐步指南

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1942540.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PyTorch手写体数字识别实例

MNIST数据集的准备 “HelloWorld”是所有编程语言入门的基础程序&#xff0c;在开始编程学习时&#xff0c;我们打印的第一句话通常就是这个“HelloWorld”。本书也不例外&#xff0c;在深度学习编程中也有其特有的“HelloWorld”&#xff0c;一般就是采用MNIST完成一项特定的…

Java二十三种设计模式-代理模式模式(8/23)

代理模式&#xff1a;为对象访问提供灵活的控制 引言 代理模式&#xff08;Proxy Pattern&#xff09;是一种结构型设计模式&#xff0c;它为其他对象提供一个代替或占位符&#xff0c;以控制对它的访问。 基础知识&#xff0c;java设计模式总体来说设计模式分为三大类&#…

Ant Design Vue中日期选择器快捷选择 presets 用法

ant写文档的纯懒狗 返回的是一个day.js对象 范围选择时可接受一个数组 具体参考 操作 Day.js 话不多说 直接上代码 <a-range-pickerv-model:value"formData.datePick"valueFormat"YYYY-MM-DD HH:mm:ss"showTime:presets"presets"change&quo…

一、C#概述

本文是网页版《C# 12.0 本质论》第一章解读。欲完整跟踪本系列文章&#xff0c;请关注并订阅我的Essential C# 12.0解读专栏。 前言 第一章的内容非常简单&#xff0c;毕竟仅仅是Introducing C#。不过正如《0.前言》所述&#xff0c;《C# 12.0本质论》本身就不是一本零基础的…

【Redis】主从复制分析-基础

1 主从节点运行数据的存储 在主从复制中, 对于主节点, 从节点就是自身的一个客户端, 所以和普通的客户端一样, 会被组织为一个 client 的结构体。 typedef struct client {// 省略 } client;同时无论是从节点, 还是主节点, 在运行中的数据都存放在一个 redisServer 的结构体中…

S71200 - 笔记

1 S71200 0 ProfiNet - 2 PLC编程 01.如何零基础快速上手S7-1200_哔哩哔哩_bilibili 西门子S7-1200PLC编程设计学习视频&#xff0c;从入门开始讲解_哔哩哔哩_bilibili

Facebook在内容创作中的新策略与机会

随着社交媒体的不断发展&#xff0c;内容创作已经成为了平台吸引和留住用户的核心竞争力。Facebook作为全球最大的社交平台之一&#xff0c;不断调整和优化其内容创作策略&#xff0c;以适应用户需求的变化和技术的进步。本文将深入探讨Facebook在内容创作中的新策略与机会&…

【深度学习】yolov8-det目标检测训练,拼接图的分割复原

项目背景 https://blog.csdn.net/x1131230123/article/details/140606459 似乎这个任务是简单的&#xff0c;利用目标检测是否可以完成得好呢? 生成数据集 利用这个代码产生数据集&#xff1a; 为了将标签转换为YOLOv5格式&#xff0c;需要将左上角和右下角的坐标转换为Y…

websocket实现进度条

websocket实现进度条 做一个简易的websocket实现进度条的练习&#xff0c;效果如下&#xff1a; 前端vue3 <template><el-progress type"circle" :percentage"this.progressValue" :status"this.perstatus" /><el-button cli…

【Python的wxauto】快速入门案例:简单操作微信发送消息

使用wxauto库发送消息是一个相对简单的过程。以下是一个详细的文字教程&#xff0c;以及相应的Python代码示例&#xff0c;指导您如何使用wxauto库发送消息。 文字教程&#xff1a;使用wxauto库发送消息 效果展示 步骤1&#xff1a;环境准备 确保您的计算机上安装了Python…

人工智能增强的心电图推导的身体质量指数作为未来心脏代谢疾病预测指标| 文献-基于人工智能(AI base)医学影像研究与疾病诊断

Title 题目 Artificial intelligence-enhancedelectrocardiography derived body massindex as a predictor of futurecardiometabolic disease 人工智能增强的心电图推导的身体质量指数作为未来心脏代谢疾病预测指标 01 文献速递介绍 心电图&#xff08;ECG&#xff09;可…

深度学习模型Transformer结构

Transformer结构是一种基于自注意力&#xff08;Self-Attention&#xff09;机制的深度学习模型&#xff0c;最初由Vaswani等人在2017年的论文《Attention Is All You Need》中提出&#xff0c;用于解决自然语言处理&#xff08;NLP&#xff09;领域的任务&#xff0c;如机器翻…

五年Java手,竟被一个用MemFire Cloud的前端给秒了

小李是个有五年经验的Java开发工程师&#xff0c;在公司里也算得上是技术大拿。可有一天&#xff0c;他却在一次项目竞赛中被一个刚入行不久的前端新手给秒了。这让他大感意外&#xff0c;不禁自问&#xff1a;“难道我的Java生涯要完了么&#xff1f;” 事情的真相是&#xf…

私密文件的绿色通道,使用极空间Docker部署视频文件加密工具『Alist-encrypt』

私密文件的绿色通道&#xff0c;使用极空间Docker部署视频文件加密工具『Alist-encrypt』 哈喽小伙伴们好&#xff0c;我是Stark-C~ 关于Alist我就不用过多介绍了&#xff0c;作为多网盘存储挂载工具&#xff0c;它不仅支持文件列表全能展示&#xff0c;还可以链接分享与下载…

# Redis 入门到精通(八)-- 服务器配置-redis.conf配置与高级数据类型

Redis 入门到精通&#xff08;八&#xff09;-- 服务器配置-redis.conf配置与高级数据类型 一、redis 服务器配置–redis.conf 配置 1、服务器端设定 1&#xff09;设置服务器以守护进程的方式运行&#xff1a; daemonize yes|no 2&#xff09;绑定主机地址&#xff1a; bin…

【unity小技巧】新输入系统InputSystem重新绑定控制按键(最全最完美解决方案)

文章目录 前言安装InputSystem,并导入重新绑定控制按键例子输入控制拿例子的重绑定按钮预制体绑定对应按钮升级文本新增全屏覆盖的提示文本配置绑定绑定当前启用的输入键禁用一些按钮的绑定和退出按键绑定状态重复绑定按钮问题重置绑定重复按钮修改按钮绑定名字添加两个变量勾选…

【常见开源库的二次开发】基于openssl的加密与解密——MD5算法源码解析(五)

一、MD5算法分析 &#xff1a; 1.1 关于MD5 “消息摘要”是指MD5&#xff08;Message Digest Algorithm 5&#xff09;算法。MD5是一种广泛使用的密码散列函数&#xff0c;它可以生成一个128位&#xff08;16字节&#xff09;的散列值。 RFC 1321: MD5由Ronald Rivest在1992…

Windows 磁盘分区样式有几种?如何查看电脑分区样式?

在使用 Windows 操作系统的过程中&#xff0c;磁盘分区是一个重要的概念。磁盘分区的方式直接影响到数据存储和系统运行的效率。磁盘分区的时候也有不同的样式&#xff0c;你知道分区类型有哪些吗&#xff1f;不同的分区样式决定了硬盘的分区方式、可支持的最大存储容量以及兼容…

某企业网络及服务器规划与设计

目录 1. 项目需求与设计... 5 1.1 项目需求... 5 1.2 组建企业网络内部网的流程... 5 1) 构思阶段... 5 2) 方案设计阶段... 6 3) 工程实施阶段... 6 4) 测试验收... 6 5) 管理维护... 7 1.3 技术可行性分析... 7 1.4 网络组网规则... 8 1.5 网络拓扑... 8 2. 项目所…

气膜体育馆内运动舒服吗—轻空间

气膜体育馆作为一种新型的体育设施&#xff0c;以其灵活的结构和高效的功能受到越来越多体育爱好者的青睐。很多人可能会担心在这种环境中运动是否会感到不适。轻空间将从气膜体育馆的结构特点、环境控制和用户体验三个方面&#xff0c;详细分析在气膜体育馆内运动的舒适度。 气…