在Windows11的WSL上运行Llama2-7b-chat 后记

news2025/4/14 11:55:16

往期的Llama2-7b-chat中我们试用了官方的demo，但是那个demo只能在代码中传入固定的对话，我稍微修改了一下，使其能在命令行中不间断对话（不具备记忆功能）

代码

import os
import torch
os.environ['PL_TORCH_DISTRIBUTED_BACKEND'] = 'gloo'
os.environ['NCCL_DEBUG'] = 'INFO'
torch.distributed.init_process_group(backend="gloo")
from typing import List, Optional
import fire
from llama import Llama, Dialog


def main(
    ckpt_dir: str,
    tokenizer_path: str,
    temperature: float = 0.6,
    top_p: float = 0.9,
    max_seq_len: int = 512,
    max_batch_size: int = 8,
    max_gen_len: Optional[int] = None,
):
   
    generator = Llama.build(
        ckpt_dir=ckpt_dir,
        tokenizer_path=tokenizer_path,
        max_seq_len=max_seq_len,
        max_batch_size=max_batch_size,
    )
    
    # 增加一个while语句，不间断在命令行中输入、输出
    while True:
        user_input = input()
        dialogs: List[Dialog] = [
            [{"role": "user", "content": f"{user_input}"}]]

        results = generator.chat_completion(
            dialogs,  # type: ignore
            max_gen_len=max_gen_len,
            temperature=temperature,
            top_p=top_p,
            logprobs=True,
        )

        for dialog, result in zip(dialogs, results):
            for msg in dialog:
                print(f"{msg['role'].capitalize()}: {msg['content']}\n")
            print(
                f"> {result['generation']['role'].capitalize()}: {result['generation']['content']}"
            )
            print("\n==================================\n")


if __name__ == "__main__":
    fire.Fire(main)

运行方式

torchrun --nproc_per_node 1 main_chat.py --ckpt_dir llama-2-7b-chat  --tokenizer_path tokenizer.model --max_seq_len 512 --max_batch_size 1

运行结果

结尾

建议使用英文，中文容易报错，后续试试把记忆功能加上去。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1424942.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

在Windows11的WSL上运行Llama2-7b-chat 后记

代码

运行方式

运行结果

结尾

相关文章

基于 LLM+LlamaIndex+NebulaGraph，构建大模型知识图谱的检索（RAG）方法

Linux部署DataEase数据分析工具并结合内网穿透实现任意设备远程查看数据

DolphinScheduler管理数仓任务规范

modbus协议和示例

并网逆变器学习笔记8---平衡桥（独立中线模块）控制

Python第十三章（递归与lamada）

一文教你如何本地搭建Qchan图床网站实现公网远程访问

endnote设置引用格式

C/C++实现无序入参的命令解析工具

多智能体强化学习--MAPPO(pytorch代码详解)

Shell脚本——免交互

杠杆交易在伦敦金市场的优势与风险

【pytorch】anaconda使用及安装pytorch

HashSet 的基本操作【集合容器知识回顾 ④】

揭开时间序列的神秘面纱：特征工程的力量

Vue中使用定义的函数时,无法访问到data()里面的数据

echarts 鼠标移入有单位；echarts 纵坐标有单位；echarts 纵坐标刻度有单位

为什么贪婪的 GPU需要快速的对象存储？

三、软硬件工作流程分析

ManticoreSearch-(安装配置,集群搭建)-学习总结