10月20日-10月22日工作:
复现S-NeRF代码,按照github的步骤进行,首先使用一个RTX3090显卡,
在下图步骤中:运行最后一步 python scripts/run.py 出现问题
继续使用两张RTX3090显卡尝试,依旧在这一步出现问题,没有得到解决。
10月23-24日 运行READ代码
READ代码,首先尝试autodl连接图形界面,安装成功,按照github步骤,下载权重以及数据,尝试看效果,但是出现问题如图
在github的issues中有人同样提出该问题,没有得到解决。怀疑还是图形界面没有安装成功
接着使用无界面进行训练,但是在验证eval时出现损失为nan的情况
github同样有几位提出该问题,没有得到解决。
10月25日 尝试suds代码
按照github步骤进行配置环境,在安装ting-cuda时出现错误,
git+https://github.com/hturki/tiny-cuda-nn.git@ht/res-grid#subdirectory=bindings/torch
10月26-27日 尝试mars代码 按照github进行配置,在安装tiny-cuda出现问题
按照以下命令安装
pip install git+https://github.com/NVlabs/tiny-cuda-nn/#subdirectory=bindings/torch
出现问题
尝试自己下载安装
git clone --recursive https://github.com/nvlabs/tiny-cuda-nn
cd tiny-cuda-nn/dependencies
git clone https://github.com/NVIDIA/cutlass.git
git clone https://github.com/fmtlib/fmt.git
cd bindings/torch
python setup.py install
在进行setup.py时 又出现问题 缺少文件,可能是gcc版本低,需要升级
按照以下步骤
# 下载源码包并解压
wget https://mirrors.cloud.tencent.com/gnu/gcc/gcc-11.2.0/gcc-11.2.0.tar.gz
tar -zxvf gcc-11.2.0.tar.gz
# 下载依赖及配置文件
cd gcc-11.2.0
./contrib/download_prerequisites
# 配置,prefix指向存储路径
mkdir build
cd build/
../configure --prefix=/path/to/install/gcc --enable-checking=release --enable-languages=c,c++ --disable-multilib
# 编译,后面的速度用来提速,与CPU相关
make -j 64
# 安装
make install
将新版gcc路径添加至~/.bashrc,如果能正确输出gcc版本,则安装成功。
vim ~/.bashrc
# 添加以下内容
export PATH="/path/to/gcc-11.2.0/bin:$PATH"
export LD_LIBRARY_PATH="/path/to/gcc-11.2.0/lib64:$LD_LIBRARY_PATH"
# 添加后,执行下列命令
source ~/.bashrc
gcc -v
接着继续setup安装,这次成功安装。
下载数据集后,进行训练,出现问题,没有得到解决,怀疑可能还是tiny-cuda安装错误。
接着修改版本,使用pytorch2.x,cuda11.7尝试,Ubuntu20.04,这里初始的gcc为9.4.0版本,可以直接运行命令:pip install… 安装,安装完成后,使用python引入tiny-cuda,出现错误
10月27-28日
重复进行了READ和mars的实验查看,依旧相同的问题,撰写实验记录