自己的小破笔记本实在炼不动高品阶的丹药, 不得已用了云服务器. 捣鼓了一天, 终于是成功把代码在云服务器上跑起来了. 将这一过程记录一下, 方便之后参考.
第一步, 创建云服务器实例
找到控制台, 点 “云服务器 ECS”, 然后点击创建实例. 会出现以下界面:
这里如何选择合适的规格成了难题, 我打电话咨询, 工作人员也没说出个所以然, 后来看了价钱以后选了V100, 即GPU 计算型 gn6e, 一小时二十, 贵死了. 镜像我选的是 Alibaba Cloud Linux, 听他吹的天花乱坠, 用一下试试吧. 千万注意, 不要图省事让她预安装cuda驱动程序, 这个地方坑死了, 我一开始图省事, 结果她只能安装cuda11.4, 这都什么年代的版本了? 我的代码直接没法跑,
然后按部就班的把之后的东西选一下就行, 基本上都是默认的就可以, 系统配置这一步我使用的是密码, 因为后期拿ssh连方便.
然后确认订单即可.
这样我们就有了一个自己的实例.
第二步, 连接实例
这里我用的Xshell + Xftp, 跑代码直接用pycharm连的, 相关配置过程不赘述, 自行Google即可.
第三步, 安装GPU驱动
上面已经说了, 阿里云虽然提供自动安装, 但是版本只能是11.4, 无法满足需求, 所以我们自行安装.
参考阿里云官方文档
第四步, 安装cuda和cudnn
参考这篇博客
出现这个页面说明安装cuda成功, 但其实我之前失败了一次, 因为选择了kernel object, 不安装这个组件就不报错了.
另外在安装cudnn的时候又出现了问题
我下载的是这个, 下面的deb文件不知道是个啥. 但是这里我直接在Linux系统上wget url, 下载下来的是个几十KB的东西, 很奇怪, 而且会报这个莫名其妙的错, 我查了半天也没发现问题, 就是报错. 估计和这个网站有关系, cudnn这个网站真难访问, 服了.
所以我就下到本机, 然后拿Xftp传过去了
注意这里我还遇到一个问题, 就是输入nvcc -V显示command not found, 解决方法见这篇博客.
终于
第五步, 安装Anaconda
参考这篇博客
第六步, 配置Python环境
参考我自己的这篇博客
第七步, 大功告成!
开始炼丹!