本地安装 vllm v0.6.4.post1

news2025/7/3 10:05:14

本地安装 vllm v0.6.4.post1

0. 引言
1. 安装 cuda
2. 安装 cudnn
3. 配置环境
4. 安装 vllm

0. 引言

此文章主要介绍本地安装 vllm v0.6.4.post1。

1. 安装 cuda

wget https://developer.download.nvidia.com/compute/cuda/12.6.2/local_installers/cuda_12.6.2_560.35.03_linux.run
sudo sh cuda_12.6.2_560.35.03_linux.run

2. 安装 cudnn

# for ubuntu 22.04
wget https://developer.download.nvidia.com/compute/cudnn/9.5.1/local_installers/cudnn-local-repo-ubuntu2204-9.5.1_1.0-1_amd64.deb
sudo dpkg -i cudnn-local-repo-ubuntu2204-9.5.1_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2204-9.5.1/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudnn

# for ubuntu 24.04
wget https://developer.download.nvidia.com/compute/cudnn/9.5.1/local_installers/cudnn-local-repo-ubuntu2404-9.5.1_1.0-1_amd64.deb
sudo dpkg -i cudnn-local-repo-ubuntu2404-9.5.1_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2404-9.5.1/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudnn

3. 配置环境

vi ~/.bashrc

--- add
export CUDA_HOME="/usr/local/cuda-12.6"
export CuDNN_HOME="/usr/local/cuda-12.6/include"
export PATH="/usr/local/cuda-12.6/bin:/usr/lib/wsl/lib:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-12.6/lib64:$LD_LIBRARY_PATH"
---

source ~/.bashrc

vi /etc/ld.so.conf

--- add
/usr/local/cuda-12.6/lib64
---

ldconfig

4. 安装 vllm

创建虚拟环境，

conda create -n vllm_v0.6.4.post1 python=3.11 -y
conda activate vllm_v0.6.4.post1

安装 Vllm，

pip install vllm==v0.6.4.post1

安装 flash-attention，

pip install flash-attn --no-build-isolation

完结！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2242418.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

本地安装 vllm v0.6.4.post1

本地安装 vllm v0.6.4.post1

0. 引言

1. 安装 cuda

2. 安装 cudnn

3. 配置环境

4. 安装 vllm

相关文章

STM32单片机设计防儿童人员误锁/滞留车内警报系统

stm32——通用定时器时钟知识点

GPIO相关的寄存器（重要）

CSS基础也要进行模电实验

i春秋-登陆（sql盲注爆字段，.git缓存利用）

探索KubeVirt：如何利用InfiniBand提升虚拟机性能

基于树莓派的边缘端 AI 目标检测、目标跟踪、姿态估计视频分析推理加速方案：Hailo with ultralytics YOLOv8 YOLOv11

小白进！QMK 键盘新手入门指南

《操作系统 - 清华大学》3 -3：连续内存分配：内存碎片与分区的动态分配

vue内置指令和自定义指令

蓝桥杯备赛（持续更新）

vue 项目使用 nginx 部署

TensorFlow 2.0 环境配置

【计算机网络】【传输层】【习题】

HarmonyOS本地存储-Preferences(用户首选项)的使用

基于Java Web 的家乡特色菜推荐系统

【售前方案】工业园区整体解决方案，智慧园区方案，智慧城市方案，智慧各类信息化方案（ppt原件）

Vue2+ElementUI：用计算属性实现搜索框功能

CSS实现炫酷的水波纹效果

【会话文本nlp】对话文本解析库pyconverse使用教程版本报错、模型下载等问题解决超参数调试