Llama3-Factory模型部署新手指南

news2025/1/16 19:12:47

一、介绍

为了保持其公司在人工智能开源大模型领域的地位,社交巨头Meta推出了旗下最新开源模型。当地时间4月18日,Meta在官网上宣布公布了旗下最新大模型Llama 3。目前,Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,上下文窗口为8k。Llama3 是 Meta 公司(前身为 Facebook)开发的一个大型语言模型(LLM),它属于人工智能和自然语言处理领域的一项技术成果。Llama3 的设计目的是理解和生成人类语言,以支持各种自然语言处理任务,包括但不限于文本生成、对话系统、问答、代码理解与生成、文本摘要、翻译等。Meta表示,通过使用更高质量的训练数据和指令微调,Llama 3比前代Llama 2有了“显著提升”。

未来,Meta将推出Llama 3的更大参数版本,其将拥有超过4000亿参数。Meta也将在后续为Llama 3推出多模态等新功能,包括更长的上下文窗口,以及Llama 3研究论文。Meta在公告中写道:“通过Llama 3,我们致力于构建能够与当今最优秀的专有模型相媲美的开源模型。我们想处理开发者的反馈,提高Llama 3 的整体实用性,同时,继续在负责地使用和部署LLM(大型语言模型)方面发挥领先作用。”

Llama3 通过深度学习技术,特别是基于 Transformer 架构的预训练模型,实现了对自然语言的高度理解和生成能力。它利用了海量的文本数据进行训练,从而能够捕获语言的复杂模式和规律,并在各种自然语言处理任务中展现出卓越的性能。

此外,Llama3 的开源性质使得它更容易被研究人员和开发者所利用,进一步推动了自然语言处理技术的发展和应用。通过再训练或微调 Llama3 模型,开发者可以针对特定领域或任务进行优化,构建出更加专业化和个性化的自然语言处理系统。

二、环境需求

操作系统:Ubuntu 22.04

Anconda3:Miniconda3-latest-Linux-x86_64.sh

GPU: RTX 3090 24G

微调时是两张4090

1.更新系统

输入下列命令将系统更新及系统缺失命令下载

apt-get update
apt-get upgrade
apt-get install -y vim wget unzip lsof net-tools openssh-server git git-lfs gcc cmake build-essential

2.创建conda环境

输入下列命令,创建一个名为“llama_factory ”且Python版本号为3.11的conda环境(环境名称可随意修改)

conda create --name llama_factory python=3.11

微信截图_20240730155518.png

3.激活conda环境

输入下列命令激活刚才所创建的codna环境:

conda activate llama_factory

微信截图_20240730155705.png

如果出现提示错误的情况,则输入下列命令进行激活conda环境:

conda activate llama_factory

4.下载项目文件

输入下列命令进行下载模型:

git clone https://github.com/hiyouga/LLaMA-Factory.git

微信截图_20240730160007.png

 如果出现提示错误的情况,则输入下列命令“ llama_factory”删除文件后重新下载:

rm -rf

5.进入项目文件

首先输入命令 ls 查看一下“LLaMA-Factory”文件是否存在,其次输入“cd LLaMA-Factory”进入模型文件,最后再输入命令“python -m pip install --upgrade pip”升级pip版本号。

ls
cd LLaMA-Factory
python -m pip install --upgrade pip

6.下载项目依赖包

输入下列命令:

pip install -r requirements.txt --index-url https://mirrors.huaweicloud.com/repository/pypi/simple

7.下载Llama3模型

  • 输入命令“mkdir model”新建一个名为“model”的文件夹
mkdir model
  • ls查看一些文件夹是否存在,输入“cd model”进入文件夹
cd model
  • 输入下列命令下载模型和权重数据集
git clone https://LLM-Research/Meta-Llama-3-8B-Instruct.git

(此模型数据很大约15G,建议下载到系统盘,下载过程很长切勿有其他操作)

8.运行

首先切换到LLama_Factory目录下

cd /LLaMA-Factory

运行下列命令运行:

CUDA_VISIBLE_DEVICES=0 
export PATH=$PATH:/path/to/llamafactory-cli 
export HF_ENDPOINT="https://hf-mirror.com" 
export GRADIO_SERVER_PORT=8080 
python src/webui.py 
	--model_name_or_path /model/Meta-Llama-3-8B-Instruct 
	--template llama3 
	--infer_backend vllm \
	--vllm_enforce_eager

微信截图_20240730171339.png

三、界面演示

1. 成功界面

微信截图_20240731161619.png

2. 报错解决

微信截图_20240731153719.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2214579.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

报表控件stimulsoft操作:使用 Stimulsoft 产品连接到 Json数据源

我们继续我们的系列文章,介绍如何在 Stimulsoft 产品中连接各种类型的数据源。在上一篇文章中,我们讨论了如何连接 OData。今天,我们将深入研究另一种类型的数据源 - JSON。 Stimulsoft Ultimate (原Stimulsoft Reports.Ultimate…

Bat To Exe Converter软件:将批处理文件bat转换成exe应用程序

Bat To Exe Converter软件: 将批处理文件bat转换成exe应用程序(文章最后附软件下载地址)Bat To Exe Converter软件可以把批处理文件bat转换为exe可执行文件,甚至运用密码保护文件,生成的.EXE是独立的文件,…

DevExpress WinForms中文教程:Data Grid - 如何点击获取信息?

在使用DevExpress WinForms的Data Grid之类控件时,可能需要实现自定义用户交互,例如显示数据行的上下文菜单,或者在双击一行时调用编辑表单。在这些情况下,您需要在指定的坐标处标识网格元素。 在本教程中,您将学习如…

Python案例 | 使用K-means 聚类算法提取图像中的颜色

假如我们需要提取下图中的颜色,可以通过使用 K-means 聚类算法对图像进行颜色聚类分析,并生成一个基于聚类中心(即最具代表性的颜色)的RGB值和调色板。 # 通过使用 K-means 聚类算法对图像进行颜色聚类分析,并生成一个基于聚类中心(即最具代…

时间序列预测(二)——前馈神经网络(Feedforward Neural Network, FNN)

上一篇文章有提到线性回归方程。 时间序列预测(二)——前馈神经网络(Feedforward Neural Network, FNN)-CSDN博客 与线性回归相比: 线性回归只有一个线性层,输入直接映射到输出,不包含隐藏层…

「漏洞复现」灵当CRM data/pdf.php 任意文件读取漏洞

0x01 免责声明 请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,作者不为此承担任何责任。工具来自网络,安全性自测,如有侵权请联系删…

网页内容获取:Scala自动化脚本的实现

对于开发者和数据科学家来说,自动化获取网页内容是一个常见的需求。Scala,作为一种多范式编程语言,以其强大的函数式编程特性和并发处理能力,成为了编写高效自动化脚本的理想选择。本文将介绍如何使用Scala结合Selenium WebDriver…

Element Ui el-table列表中的tooltip内容过长超出屏幕换行显示

elementui-table组件列表中的tooltip内容过长超出屏幕换行显示内容,虽然el-table列属性中带的有show-overflow-tooltip,可以设置内容超出列宽度显示为…,且有tooltip提示全部内容,但是内容过多时,提示会超出屏幕: 只有…

芒果YOLOv10改进136:注意力机制MLLA|即插即用:融合Mamba设计精髓的线性注意力视觉Transformer

💡本篇内容:芒果YOLOv10改进136:即插即用,最新注意力机制MLLA:融合 Mamba 设计精髓的线性注意力视觉Transformer MLLA|Mamba-Like Linear Attention 模块 | 即插即用 该模块将选择性的状态空间模型和线性注意力在一个统一公式中进行了重新阐述,将Mamba重新定义为具有六个主…

从头开始的可视化数据 matplotlib:初学者努力绘制数据图

从头开始学习使用 matplotlib 可视化数据,对于初学者来说,可能会有些挑战,但 matplotlib 的核心理念非常清晰:绘制图表需要了解如何设置图形、坐标轴以及如何用数据填充它们。我们可以通过一些简单的例子来逐步介绍基本步骤。 1. …

小程序底部导航按钮实现

商城小程序需要四个底部导航按钮,遂记录一下实现过程 最终实现效果如下所示 新建一个小程序项目,我是创建了JS模板,项目创建完成后需要新建五个文件夹,其中四个(page子文件夹)用于存放pages文件&#xff0…

探索光耦:光耦——不间断电源(UPS)系统中的安全高效卫士

在现代社会,不间断电源(UPS)系统已成为保障关键设备和数据安全的关键设施,广泛应用于企业数据中心、家庭电子设备等场景。UPS能在电力中断或波动时提供稳定电力,确保设备持续运行。而在这套系统中,光耦&…

C# 使用S7netplus读取西门子PLC的DB块-S7协议

在工业的设备监控领域,S7协议使用比较普遍下面简单教大家使用 1、添加包 2、添加帮助类(读写数据就研究该类即可,具体的理论就不多说了) //plc中类型与c#类型 bool > Bit //Byte > byte //word > ushort //DWord > uint //Int > short …

【AI知识点】三种不同架构的大语言模型(LLMs)的区别

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI大项目】【AI应用】 在自然语言处理(NLP)中,预训练语言模型(LLMs, Large Language Models)通常基于不同的架构,如仅编码器的模型(Enc…

Java开发中知识点整理

正则表达式 测试网址 Git 分支和主分支有冲突 先checkout origin/分支把origin/master pull进本地分支 修改冲突MergeCommit and Push

Apache SeaTunnel 介绍

SeaTunnel是一个非常易用、超高性能的分布式数据集成平台,支持实时海量数据同步。 每天可稳定高效同步数百亿数据,已被近百家企业应用于生产。 为什么需要 SeaTunnel​ SeaTunnel专注于数据集成和数据同步,主要旨在解决数据集成领域的常见问…

【OSCP Proving Grounds 靶场系列】Slort

作者:Eason_LYC 悲观者预言失败,十言九中。 乐观者创造奇迹,一次即可。 一个人的价值,在于他所拥有的。可以不学无术,但不能一无所有! 技术领域:WEB安全、网络攻防 关注WEB安全、网络攻防。我的…

121页满分PPT | XX集团SAP ERP业务蓝图规划方案

这份PPT是德勤的集团SAP ERP业务蓝图规划方案的详细介绍,涵盖了项目背景、总体目标、ERP总体蓝图规划、总体规划路线设计以及风险与保障措施。方案强调了在煤炭市场疲软的宏观背景下,集团如何通过ERP系统实施来加强管控、提升业财管理一体化,…

VSCode esp-idf环境搭建 报错 ERROR_INVALID_PIP

例如我的报错提示 D:\APP\Espressif\idf531\Espressif\tools\idf-python\3.11.2\python.exe -m pip" is not valid. (ERROR_INVALID_PIP)找到目录位置D:\APP\Espressif\idf531\Espressif\tools\idf-python\3.11.2 使用下面的指令更新pip python -m ensurepippython -m …