【阿里云试用计划】免费试用GPU

news2024/11/25 22:43:30

写在前面:本博客仅作记录学习之用,部分图片来自网络,如需引用请注明出处,同时如有侵犯您的权益,请联系删除!


文章目录

  • 前言
  • 试用步骤
  • 问题
    • No CUDA GPUs are available
    • 无故被killed
  • 致谢


前言

算力在深度学习中扮演着非常重要的角色,深度学习模型通常包含大量的参数和复杂的计算图,需要对大规模数据进行训练和推断。随着数据集越来越大,各种深度学习任务如图像、扩散模型、多模态、大模型等对算力的要求也稳步较高、为提高模型性能网络参数也逐步提升,以至于想要体验都不方便,更别提需要训练网络的学生。因此白嫖算力成为一种无奈之举,下面提供一种途径:阿里云试用计划。希望对小伙伴们有帮助。

试用步骤

阿里云深度学习服务器和常见AutoDL、mistGPU略有不同,想要快速上手参考下列步骤。

网址:阿里云免费试用,注意这是针对新用户的活动,截止时间8.31。因此需要注册一个账号。
界面如下:
在这里插入图片描述

  • 点击机器学习平台,进入下图

在这里插入图片描述

  • 点击交互式建模,最好看下试用教程。教程是stable-diffusion,因此体验文字(英文)生成图像跟着教程即可。立即试用,进入下图

在这里插入图片描述

  • 跟着试用教程,创建实例。这里是我以前创建的实例。创建实例,进入下图
    在这里插入图片描述
  • 配置实例。名称啥的随意,注意选择GPU、镜像(体验教程记得选择stable-diffusion的镜像)。创建实例,进入下图

在这里插入图片描述

  • 确认配置和金额后创建,如需要安全组、交换机等可自行创建。确认无误后创建
    在这里插入图片描述
  • 再次进入交互式建模,可以看到就创建好实例了,后面就是环境和数据上传了。
    在这里插入图片描述
  • 选择实例进入,可以具体的配置信息。

在这里插入图片描述

  • 开机进入实例,主要是jupyter、webIDE、终端。教程stable-diffusion主要在jupyter中,创建配置环境并实现生成图像。如果需要配置自己的环境,进入终端,使用pip配置即可。

在这里插入图片描述

  • 数据,默认挂载需要oss或者ssd,如果数据集很大的话还是建议去挂载。数据不大直接上传打包上传即可,避免其他一些操作。调试修改使用webIED,这个使用ssh和比较麻烦,不方便和pycharm配合使用。
    在这里插入图片描述

  • 在解压出来,使用以下命令

  • unzip yourdata.zip -d unzip_path

  • 最后运行,芜湖起飞。
    在这里插入图片描述


问题

No CUDA GPUs are available

详细的报错内容:出现在 .to(device)

torch._C._cuda_init() No CUDA GPUs are available

但是torch显示cuda可用,如下

torch.cuda.is_available()  # true
torch.cuda.device_count()  # 1

解决办法:
在脚本中添加:

os.environ['CUDA_VISIBLE_DEVICES'] = '0'

无故被killed

报错截图如下:
在这里插入图片描述
原因:占用的显存太大,系统为保持稳定,kill进程。
解决办法:调小参数,如batch-size等,占用显存略小于16G即可。

致谢

欲尽善本文,因所视短浅,怎奈所书皆是瞽言蒭议。行文至此,诚向予助与余者致以谢意。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/782474.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ESP-EYE-使用记录

文章目录 1 测试平台2 相关网站3 搭建ESP-IDF环境4 HTML 文件修改 1 测试平台 2 相关网站 Gitee 平台下 《乐鑫开源 / esp-who》乐鑫官网ESP-EYE板子介绍Github 平台下 esp-whoGitee 平台 《ESP-EYE 入门指南》乐鑫官网ESP-EYE板子资料下载 3 搭建ESP-IDF环境 主要参考 《乐…

【OpenCV】windows环境下,java OpenCV环境搭建,java 也可以实现opencv的功能了!opencv自由了

目录 1. 下载opencv 2. 安装opencv 目录 1. 下载opencv 2. 安装opencv 3. dll文件的导入配置 dll文件的导入: (C的类库文件),opencv是c开发的类库,java语言要调用其中的方法,所以依赖了dll文件 3.1…

oracle 使用笔记

1.查看用户信息 查看oracle用户信息:id oracle 2.查看、编辑、复制、创建文件 查看:cat /etc/sysctl.conf 编辑:vi /etc/sysctl.conf 复制: cp /home/oracle/database/response/* /home/oracle/etc/ 创建:mkdir /h…

我的踩坑记录!!!积累中......

bug记录: 解决 nodejs安装后,在安装目录下【nodejs】创建两个文件夹【node_global】及【node_cache】用来配置全局环境变量。 之后,打开cmd命令窗口,输入 npm config set prefix ”D:\Program Files\nodejs\node_global” npm con…

KubeVela篇07:terraform controller实现原理

terraform-controller是一个专门负责terraform一类的组件"安装"的Operator,通过打包成helm,再封装成kubevela的Addon,由kubevela安装到管控集群,为其它terraform provider插件提供模块定义支持。 从前面kubevela安装一个Application的原理我们了解到,当一个如a…

pytest自动化测试指定执行测试用例

1、在控制台执行 打开cmd,进入项目目录 指定执行某个模块 pytest testcases\Logistics\Platform\CarSource\test_CarSourceList.py 指定执行某个目录及其子目录的所有测试文件 pytest testcases\Logistics\Platform\CarSource 指定执行某个模块的某个类的某个测试用例 pyte…

C进阶:文件操作

C语言文件操作 什么是文件 磁盘上的数据是文件。 但是在程序设计中,我们一般谈的文件有两种:程序文件(例如.c,.h这一类编译,链接过程中的文件),数据文件。 程序文件 包括源程序文件(后缀为.c&…

【Three.js基础入门】:创建你的第一个3D场景

引言: Three.js是一种强大的JavaScript库,用于在Web浏览器中创建交互式的3D图形和动画。无需熟练的图形编程经验,你也可以通过Three.js轻松地构建令人惊叹的3D场景。 本文将带你逐步学习如何入门Three.js,从创建一个简单的3D场景开…

认识spring项目的创建 和 从spring中进行Bean对象的存取

前言 本篇简单介绍如何创建spring项目,如何存储到spring容器中,如何从容器中获取Bean对象,如有错误,请在评论区指正,让我们一起交流,共同进步! 文章目录 前言1. 创建spring项目2. 将Bean对象存…

信息与通信工程学科面试准备——通信原理|信息与通信工程方向保研面试题集|BUAA

注意: 以下内容,基本上都是二系通信方向保研复试被提问过的内容。如果是专硕,那么电路分析、电磁场、DSP等方面的问题会更多,这里主要针对通信学硕。以下内容不能保证全覆盖:有的同学被问到什么是范德蒙行列式&#x…

[SQL挖掘机] - SQL挖掘机系列整体规划

这里直接进行相关操作, 在Linux或者Windows系统如何安装MySQL, 可以参考博客平台其他大佬的分享. 还有就是, 这里相当于是从数据库–>数据表–>各种约束–>数据类型–>数据表的增删改等操作, 最后就是主要的数据表的查询操作了, 其他的内容根据自己的学习进程进行…

shell脚本中getopts的使用

在shell中,getopts用于解析命令选项和参数。getopts是Bash shell的内置命令,不支持长选项,仅解析短选项,即一个破折号("-")和一个字母或数字,如-1,-e, -E等。 getopts格式如下:…

ATF(TF-A)之sonarlint静态代码分析实战

ATF(TF-A)/OPTEE之静态代码分析汇总 一、ATF源码下载及分析 对ATF实施soanrlint静态代码扫描之前,先到官方网站下载源码。官方网站位于github,网址 GitHub - ARM-software/arm-trusted-firmware: Read-only mirror of Trusted Firmware-A。 各发布版本及对应的时间节点如下…

算法图解注疏(待续)

目录 算法简介二分查找简单查找更佳的查找方式二分查找的几种模板模板1模板2模板3 运行时间 大O表示法大O表示法指出了最糟情况下的运行时间一些常见的大O运行时间 O(n!)旅行商问题 选择排序内存的工作原理数组和链表选择排序 递归基线条件和递归条件栈递归调用栈 快速排序分而…

Istio Pilot源码学习(二):ServiceController服务发现

本文基于Istio 1.18.0版本进行源码学习 4、服务发现:ServiceController ServiceController是服务发现的核心模块,主要功能是监听底层平台的服务注册中心,将平台服务模型转换成Istio服务模型并缓存;同时根据服务的变化&#xff0c…

MongoDB 的日常使用

一、简介 1、 常见的数据库分类 RDBMS(关系型数据库):常见的关系型数据库有 Oracle、DB2、Microsoft SQL Server、Microsoft Access、MySQL; NoSQL(非关系型数据库):常见的非关系型数据库有 …

算法笔记(java)——回溯篇

回溯算法解决问题最有规律性,借用一下卡哥的图: 只要遇到上述问题就可以考虑使用回溯,回溯法的效率并不高,是一种暴力解法,其代码是嵌套在for循环中的递归,用来解决暴力算法解决不了的问题,即…

【机器学习】模型常用评估指标

L0 范数、L1 范数、L2 范数、余弦距离 向量的范数可以简单形象理解为向量的长度,或者向量到零点的距离,亦或是相应两个点之间的距离。因此范数通常会对应一个距离概念。 L0 范数 L0 范数表示向量中非零元素的个数: ∣ ∣ x ∣ ∣ 0 # ( i…

elasticsearch IK分词器

说明:es默认的分词器对中文的识别不是特别好,一段话的分词是一个一个汉字,这显然没有达到想要的结果。 可以安装IK分词器,兼容中文的分词; IK分词器 安装 安装IK分词器,例如elasticsearch的容器名为es&a…

探索Java并发编程利器:LockSupport,一种高效的线程阻塞与唤醒机制

关于作者:CSDN内容合伙人、技术专家, 从零开始做日活千万级APP。 专注于分享各领域原创系列文章 ,擅长java后端、移动开发、人工智能等,希望大家多多支持。 目录 一、导读二、概览三、用法四、原理五、线程等待和唤醒的方法5.1 Lo…