最少钱学习并构建大模型ollama-llama3 8B

news2024/11/18 15:40:28

学习大模型时可能面临一些困难,这些困难可能包括

  1. 计算资源限制:训练大模型通常需要大量的计算资源,包括CPU、GPU等。如果设备资源有限,可能会导致训练时间长、效率低下或无法完成训练。

  2. 内存限制:大模型通常需要大量内存来存储模型参数和计算中间结果。内存限制可能会导致内存不足错误或无法加载大模型。

  3. 数据集规模:训练大模型通常需要大规模的数据集来获得良好的性能。获取和处理大规模数据集可能需要大量时间和计算资源。

  4. 超参数调整:调整大模型的超参数通常是一项挑战性工作。需要花费大量时间和资源来尝试不同的超参数组合,以获得最佳性能。

  5. 过拟合:大模型很容易过拟合,特别是在数据集规模不够大或训练不充分的情况下。需要采取适当的正则化策略来避免过拟合。

  6. 模型解释性:大模型通常更加复杂,其内部结构可能不太容易解释。理解大模型的行为和推理过程可能是一项挑战。

  7. 时间和精力投入:学习大模型需要花费大量的时间和精力,包括数据准备、模型训练、调优等过程。需要有耐心和毅力来应对这些挑战。

解决资源问题

1、选择按小时付费GPU性能服务器

仙宫云 | GPU 算力租赁 | Xiangongyun.com

2、sh直接安装Ollama

curl -fsSL https://ollama.com/install.sh | sh

AMD Radeon GPU 支持¶

虽然 AMD 已将 amdgpu 驱动程序上游贡献给官方 Linux 内核源代码,但该版本较旧,可能不支持所有 ROCm 功能。我们建议您从 AMD 官网 安装最新驱动程序,以获得对您 Radeon GPU 的最佳支持。

 手动下载 ollama 二进制文件安装

Ollama 以自包含的二进制文件形式分发。将其下载到您的 PATH 中的目录:

curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama
chmod +x /usr/bin/ollama


将 Ollama 添加为启动服务(推荐)
为 Ollama 创建一个用户:


useradd -r -s /bin/false -m -d /usr/share/ollama ollama

在 /etc/systemd/system/ollama.service 中创建一个服务文件:


[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3

[Install]
WantedBy=default.target


然后启动服务:

systemctl daemon-reload
systemctl enable ollama


启动 Ollama
使用 systemd 启动 Ollama:


systemctl start ollama

安装 CUDA 驱动程序(可选 - 适用于 Nvidia GPU)

Download and install CUDA.

通过运行以下命令验证驱动程序是否已安装,该命令应打印出有关您 GPU 的详细信息:

nvidia-smi

安装 ROCm(可选 - 适用于 Radeon GPU)

Download and Install

确保安装 ROCm v6

更新sh直接安装Ollama

通过再次运行安装脚本来更新 ollama:

curl -fsSL https://ollama.com/install.sh | sh

或者通过下载 ollama 二进制文件:

sudo curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

查看日志

要查看作为启动服务运行的 Ollama 的日志,请运行:

journalctl -u ollama

卸载

移除 ollama 服务:

sudo systemctl stop ollama
sudo systemctl disable ollama
sudo rm /etc/systemd/system/ollama.service

从您的 bin 目录(/usr/local/bin/usr/bin 或 /bin)中移除 ollama 二进制文件:

sudo rm $(which ollama)

移除下载的模型以及 Ollama 服务用户和组:

sudo rm -r /usr/share/ollama
sudo userdel ollama
sudo groupdel ollama

3、打开终端: 输入ollama

终端执行指令:ollama serve & 

终端执行指令「下载模型」:ollama run llama3

4、检查安装成功

curl 127.0.0.1:11434  或者   lsof -i:11434

5、安装 open-webui

#1.拉取源码
cd ~
git clone https://github.com/open-webui/open-webui.git
cd open-webui
cp -RPp .env.example .env

#2.安装前端依赖
npm i
npm run build


#3.安装后端依赖
cd backend
pip install -r requirements.txt

#4.启动后端
bash start.sh

默默端口:8080 ,可以修改start.sh 文件端口更改:80 

仙宫云 | GPU 算力租赁 | Xiangongyun.com 

6、完成「选择默认模型」

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2066099.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

卫星图揭秘《黑神话:悟空》山西取景地

8月20日,国产单机游戏巨制《黑神话:悟空》在全球同步解锁,游戏以《西游记》为背景,并以其精美的画面和深刻的剧情吸引了全球玩家,被誉为“国产游戏之光”。 游戏画面在国内36处实地取景,其中有27个来自山西…

日志审计Graylog 使用教程-kafka收取消息

Graylog 是一个开源的日志管理和分析平台。它主要用于收集、存储、处理和分析大量的日志数据。Graylog 的核心功能包括: 日志收集:Graylog 可以从各种来源(如服务器、网络设备、应用程序等)收集日志数据。它支持多种输入方式&…

122-域信息收集应用网络凭据CS插件AdfindBloodHound

参考:【内网安全】域信息收集&应用网络凭据&CS插件&Adfind&BloodHound_ladon adfinder bloodhound-CSDN博客 工作组和域环境 我的理解: 工作组就是还是局域网一样只是大一点里面的电脑很多,每个电脑还是都是单独的电脑没有…

萤石C++ SDK Demo播放4G摄像头

萤石开放平台官方提供的Demo是有问题的,无法直接使用。提交工单后,技术人员回复要修改配置文件才能使用。 1. 下载SDK 2.修改配置文件EZPCOpenSDK_v5.1.18_build20230808\demo\win32\EzvizQtDemo.ini 3.运行EzvizQtDemo1.exe 点击左上角【登录】按钮&am…

黑神话悟空,高清壁纸、原画,游戏截图

黑神话悟空,高清壁纸、原画,游戏截图: 链接:https://pan.quark.cn/s/cd17c05c4f33

安卓工控主板在轨道交通中的应用特点

安卓工控主板在轨道交通中的应用特点主要体现在以下几个方面: 一、高效的数据处理与通信能力 强大的处理能力:安卓工控主板通常搭载高性能的处理器,如某些型号可能搭载飞腾D2000八核CPU等,这些处理器能够高效处理轨道交通系统中…

C语言学习——用指针处理链表

目录 11.7用指针处理链表 链表概述 简单链表 处理动态链表所需的函数 malloc函数 calloc函数 free函数 建立动态链表 输出链表 对链表的删除操作 对链表的插入操作 对链表的综合操作 11.7用指针处理链表 链表概述 链表是一种常见的数据结构。它是动态地进行存储分…

【架构设计】-- aarch(ARM) and X86

1、aarch(ARM) 架构 (1)操作系统支持:早期为 32 位操作系统,目前大部分都是 64 位操作系统 (2)全称:Advanced RISC Machine,由英国ARM Holdings plc公司开发 这种架构主要⽤于智能…

chatglm3-6b下载时,需要下载哪些文件

在huggingface或modelscope上下载chatglm3-6b时,会发现有两种可执行文件,一种是.bin,一种是.safetensors,在使用的时候你如果直接用git命令git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git直接下载,你会…

【中仕公考怎么样】事业编ABCDE类对应的专业

事业编考试分为ABCDE五个类别,对应的专业分别是: 综合应用能力(A类): 招聘专业:汉语言与文秘类、法律类、新闻传播类、治安学、治安管理、社会工作、老年服务、青少年服务、思想政治教育、安全工程、公共事业管理、行政管理、人力…

前端打字效果

页面效果链接&#xff0c;点击查看https://live.csdn.net/v/419208?spm1001.2014.3001.5501 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, …

图像处理之:Video Processing Subsystem(一)

免责声明&#xff1a; 本文所提供的信息和内容仅供参考。作者对本文内容的准确性、完整性、及时性或适用性不作任何明示或暗示的保证。在任何情况下&#xff0c;作者不对因使用本文内容而导致的任何直接或间接损失承担责任&#xff0c;包括但不限于数据丢失、业务中断或其他经济…

deque容器的所有操作

1.deque原理 2.deque构造函数 只读迭代器这么写&#xff1a; 3.deque赋值操作 4.deque大小操作 5.deque插入和删除操作 6.deque数据存取 7.deque排序

Linux阿里云服务器,利用docker安装EMQX

第一步&#xff0c;给云服务器docker进行加速 阿里云搜索“镜像加速器”&#xff0c;找到下面这个菜单&#xff0c;点进去 然后找到镜像工具下的镜像加速器 把这个加速器地址复制 然后在自己的云服务器中&#xff0c;找到docker的文件夹 点击json配置文件 把地址修改为刚刚…

边坡监测预警摄像机

边坡是指山体或河岸等地表的斜坡部分&#xff0c;由于受到地质构造、气候变化等因素的影响&#xff0c;边坡可能存在塌方、滑坡等危险情况。为了及时监测和预警边坡的变化情况&#xff0c;可以使用边坡监测预警摄像机 。 边坡监测预警摄像机是一种结合了摄像技术和智能算法的设…

算法的学习笔记---按之字形顺序打印二叉树

&#x1f600;前言 在算法的学习中&#xff0c;二叉树是一种非常基础但又十分重要的数据结构。今天&#xff0c;我们将讨论一种特殊的二叉树遍历方法&#xff1a;之字形顺序打印。这个方法要求我们以“之”字形的顺序遍历并打印二叉树的节点值&#xff0c;也就是第一行从左到右…

开放式耳机别人能听到吗?现在开放式耳机用防漏音效果越来越好!

回答&#xff1a; 开放式耳机的通透的设计允许一部分声音泄露出来&#xff0c;因此站在您旁边的人确实有可能听到您耳机中的声音&#xff0c;尤其是当音量设置得比较高时。开放式耳机通常提供更为自然和宽敞的听感&#xff0c;但牺牲了一定的隔音效果和隐私性。如果您需要在公…

台球助教在线预约小程序源码开发:打造便捷高效的台球学习新体验

在当今快节奏的生活中&#xff0c;台球作为一项集休闲、竞技与社交于一体的运动&#xff0c;受到了越来越多人的喜爱。然而&#xff0c;对于初学者而言&#xff0c;想要快速提升技能&#xff0c;往往需要专业的指导和陪练。传统的台球教练预约方式往往存在信息不对称、预约流程…

Qt实现圆型控件的三种方法之子类化控件并重写paintEvent

前言 最近在研究绘制各种形状的控件&#xff0c;这里专门挑出圆形的控件进行记录&#xff0c;其它形状的也大差不差&#xff0c;会了圆形的之后其它的也类似。 正文 这里我挑出Label来进行举例。 子类化 QLabel 并重写 paintEvent 如果需要更复杂的自定义绘制&#xff0c;…

医疗器械维修技术——开启成功之门的钥匙

随着现代医疗科技的飞速发展&#xff0c;医疗器械的精密程度和复杂性与日俱增。这些高科技的医疗设备&#xff0c;不仅是医生诊断和治疗疾病的得力助手&#xff0c;更是患者重获健康的希望之光。然而&#xff0c;如同任何复杂的机器一样&#xff0c;医疗器械也难免会出现故障和…