安装torch2.1.2 with cuda11.8
由于清华镜像源(包括阿里源和豆瓣源)都没有torch2.1.2+cu118的包,因此只能从pytorch官网下载。
服务器上直接通过下面pip的方式安装会由于网络原因中断,无奈只能在本地先把torch的包下载下来再上传到服务器离线安装。
pip install torch==2.1.2+cu118 torchvision==0.16.2+cu118 --extra-index-url https://download.pytorch.org/whl/cu118
将torch包(torch-2.1.2+cu118-cp38-cp38-linux_x86_64.whl)上传到服务器后,pip离线安装命令如下。
pip install torch-2.1.2+cu118-cp38-cp38-linux_x86_64.whl
这时会发现安装torch需要下载多个依赖包,直接去pip源下载非常慢还容易因为网络中断,由于离线安装torch包,这里也没法通过-i https://pypi.tuna.tsinghua.edu.cn/simple
的方式换源(也可以有办法,但我试了不行),但可以设置全局永久替换来解决这个问题。
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
安装torchvision0.16.2+cu118类似。
安装 tiny-cuda-nn
这里就踩了更多坑了。
如果能正常访问github,那么按照nerfstudio教程,用下面这条命令就可以解决了。
pip install ninja git+https://github.com/NVlabs/tiny-cuda-nn/#subdirectory=bindings/torch
但服务器不能访问GitHub,没办法只能参考tiny-cuda-nn的README走离线安装。在这之前,先把ninja包安装了,由于上面给pip换过清华源了,所以这里安装很顺畅。
首先,检查gcc版本、cuda版本和cmake版本。
然后在本地clone tiny-cuda-nn的库和它依赖的子库(cutlass和fmt包),如果你本地能顺利的clone完,那么万事大吉,可以按照readme进行cmake编译了。如果你和我一样,好不容易clone完tiny-cuda-nn,在clone子库的时候网络超时中断了,这个时候可以选择单独clone cutlass和fmt包。
git clone --recursive https://github.com/nvlabs/tiny-cuda-nn
clone子库不幸超时的解决方案:
cd tiny-cuda-nn/dependencies
git clone https://github.com/NVIDIA/cutlass.git
git clone https://github.com/fmtlib/fmt.git
下面就可以cmake离线编译tiny-cuda-nn了。(实际上可能还有两个坑在后面hh)
cd tiny-cuda-nn
tiny-cuda-nn$ cmake . -B build -DCMAKE_BUILD_TYPE=RelWithDebInfo
这一步可能会遇到找不到cuda compiler的情况。即使你使用nvcc -V
查看到你本地已经按要求安装了11.8版的cuda。
这是由于cuda的版本和gcc的版本不兼容导致的,参考StackOverflow上的回答,11.8版的cuda最高支持到11版的gcc,如果你不幸gcc版本高了,没关系卸载重装就行。
没遇到cuda compiler问题的可以进行下一步cmake编译,如果你网络好是–recursive安装好cutlass和fmt包的,那么你应该不会遇到问题。
tiny-cuda-nn$ cmake --build build --config RelWithDebInfo -j
如果你是手动安装cutlass和fmt包的,那么你可能会在编译到65%时遇到问题,这是由于手动安装的包版本和tiny-cuda-nn要求的不一致了,解决办法是按照tiny-cuda-nn的版本对cutlass和fmt包分别通过git checkout
到规定的版本。
以fmt包为例,直接checkout会报错,需要先git stash
,然后再git checkout
。
解决完上述问题后,再执行cmake编译,这一步编译时间可能会有点长(不会太长,耐心等待下)。
至此,就算基本完成nerfstudio的安装了,后面就按步骤走就行。(至少我没遇到问题了)
在nerfstudio的conda环境里install tiny-cuda-nn。
tiny-cuda-nn$ cd bindings/torch
tiny-cuda-nn/bindings/torch$ python setup.py install
直接pip install安装nerfstudio。
pip install nerfstudio
搞定!