I. 完整流程
按照DeepSpeed要求步骤安装,即
Windows
Windows support is partially supported with DeepSpeed. On Windows you can build wheel with following steps, currently only inference mode is supported.
- Install pytorch, such as pytorch 1.8 + cuda 11.1
- Install visual cpp build tools, such as VS2019 C++ x64/x86 build tools
- Launch cmd console with Administrator privilege for creating required symlink folders
- Run python setup.py bdist_wheel to build wheel in dist folder
1.1 安装pytorch和cuda
默认已经安装python(版本>=3.7,我安装的是python 3.9),安装CUDA和cuDNN(需要账号登录)
CUDA安装
链接:https://developer.nvidia.com/cu
下载后按照步骤进行安装,配置环境变量:
cuDNN安装
版本选择CUDA 11.x -> Local Installer for Windows (zip)
下载完成后,打开并将其中的文件解压到CUDA安装目录对应的文件夹下
安装pytorch
1.2 安装VS
这部分参考:https://blog.csdn.net/feking2/article/details/130160845
1.4 编译deepspeed
build_win.bat
或者运行命令
python setup.py bdist_wheel
1.5 安装deepspeed
编译成功后,在dist文件夹下会生成一个wheel文件
运行命令:
pip install "deepspeed-0.9.5+unknown-cp39-cp39-win_amd64.whl"
到此,deepspeed在win10上安装完成。
报错集合:
1、python setup.py bdist_wheel DS_BUILD_OPS=1 test.c LINK : fatal error LNK1181: 无法打开输入文件“aio.lib”
解决版办法:
set DS_BUILD_OPS=0
然后再执行build_win.bat
报错2:import dskernels ModuleNotFoundError: No module named 'dskernels'
这次的错误是因为缺少名为 dskernels
的模块,这通常是 DeepSpeed 所需的一个依赖项。
在 Windows 上构建 DeepSpeed 可能会遇到各种兼容性问题,因为 DeepSpeed 主要是为 Linux 环境设计的。而且,在 Windows 上安装 DeepSpeed 也相对较为复杂。
这个报错,找了很多答案,没有完美解决,我在设置了报错1后自动就没有了这个报错,
其他报错可以评论区回复,谢谢