基于vllm部署大模型

news2025/7/5 19:41:59

VLLM（非常大的语言模型）在中文中通常指的是经过大量文本数据训练的神经网络模型，能够理解和生成类似人类语言的文本。这类模型是许多先进AI系统的核心，比如ChatGPT、GPT-4等。

VLLM 可以执行各种任务，如自然语言处理、文本生成、翻译、问答系统等。它们在处理大量数据的情况下表现出色，能够为各种语言应用提供支持。

(官方网址:)[https://vllm.ai]
(官方 github 地址:)[https://github.com/vllm-project/vllm]

部署大模型

基于agiclass创建算力服务器
启动实例
打开本地终端，远程连接

ssh -p 40227 root@connect.cqa1.seetacloud.com

移动文件夹

mv Yi-6B-Chat/ /root/autodl-tmp/

启动服务

python -m vllm.entrypoints.openai.api_server --model /root/autodl-tmp/Yi-6B-Chat --trust-remote-code --port 6006

启动服务器实例自定义服务

ssh -CNg -L 6006:127.0.0.1:6006 root@connect.cqa1.seetacloud.com -p 40227

本地测试 http://127.0.0.1:6006/ 地址
在这里插入图片描述

终端访问地址

curl http://127.0.0.1:6006/v1/chat/completions \
    -H "Content-Type: application/json" \
    -d '{
        "model": "/root/autodl-tmp/Yi-6B-Chat",
        "max_tokens":60,
        "messages": [
            {
                "role": "user",
                "content": "你是谁？"
            }
        ]
    }'

本地pycharm调用

from openai import OpenAI

# Modify OpenAI's API key and API base to use vLLM's API server.
openai_api_key = "EMPTY"
openai_api_base = "http://localhost:6006/v1"
client = OpenAI(
    api_key=openai_api_key,
    base_url=openai_api_base,
)
completion = client.chat.completions.create(
    messages = [
        {
            "role": "user",
            "content": "你是谁"
        }
    ],
model="/root/autodl-tmp/Yi-6B-Chat"
)
print(completion.choices[0].message.content)

输出如下

你好！我是零一万物开发的智能助手，我叫 Yi，我是由零一万物的研究团队通过大量的文本数据进行训练的。我旨在为用户提供各种信息查询、文本理解和自然语言处理方面的帮助。如果您有任何问题或需要帮助，请随时告诉我！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2050979.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

基于vllm部署大模型

部署大模型

相关文章

【实用工具】使用Chrome插件搭建第二大脑！SuperMemory大语言模型登场，开源、免费、保存你需要的所有网站！——含入门安装教程

RTD2739 8K60Hz/4K 240Hz

理解Linux中的作业控制：详解fg、bg和jobs命令

成为Python砖家(1): 在本地查询Python HTML文档

【MySQL】order by 的排序策略

小白做毕设——HTTP扫盲

ubuntu20.04挂载机械硬盘

web技术1——http详解(重要)

低代码平台工具 —— 公式编辑器

pql语言学习

TypeScript系列之--有趣理解函数类型泛型

flink车联网项目：业务实现2（维表开发）（第68天）

C:每日一练：单身狗（2.0版本）

小型企业客户关系管理系统pf

推送本地windows环境镜像到阿里云镜像仓库

代码随想录算法训练营_day18

SpringBoot基础(二)：配置文件详解

论文阅读笔记：The Graph Neural Network Model

【Docker】Docker Compose（容器编排）

关于Python3项目中依赖包管理问题