曙光超算平台如何使用以及常见问题

news2025/2/27 6:47:49

 官方参考链接如下,有需要的自取:

Notebook · 计算服务

 了解常用的E-shell命令

(1) squeue: 查看目前提交作业的信息

(2) salloc :抢占计算资源命令

salloc -p wzhdtest -N 1 -n 8 --gres=dcu:1

(部分地区有绑卡机制,比如乌镇,核数和卡数的比=8:1)

注:salloc之后如果需要使用dcu ,则需要ssh到相应的计算节点,比如我这里的计算节点是b03r4n14,我就需要ssh  b03r4n14

(3) hy-smi :查看DCU利用率

常见问题 

<1> 如果想用pip安装相关的工具包,需要注意安装到对应的环境。我这里需要先  source  pytorch_env.sh  ,然后直接用 pip install  xxx 即可。

我pytorch_env.sh 脚本文件中的内容如下:

source ~/.bashrc
conda activate pytorch_1.10
module switch compiler/dtk/22.04.2
LD_LIBRARY_PATH=/public/software/apps/DeepLearning/PyTorch_Lib/lib:/public/software/apps/DeepLearning/PyTorch_Lib/lmdb-0.9.24-build/lib:/public/software/apps/DeepLearning/PyTorch_Lib/opencv-2.4.13.6-build/lib:/public/software/apps/DeepLearning/PyTorch_Lib/openblas-0.3.7-build/lib:$LD_LIBRARY_PATH

 <2> 如果你pip安装失败了,可以考虑三方面原因:

a. 各安装包之间的版本不兼容,可以考虑用pip uninstall 卸载再重新安装相兼容的版本。我曾遇到setuptools 的版本太高(高于60),导致tensorboard安装包安装不上。我将setuptools版本换成56.1.0之后就可以安装成功了。

b.  如果你明明pip install 了相关的安装包,但是运行程序时,却出现找不到module的错误,这个时候你可能就是将安装包安错了环境。比如我使用的是pytorch框架,那么我需要在相应的环境下(pytorch_1.10)安装,而不是(base) 环境下。

c. 如果你用salloc抢占资源,然后又用ssh登录到了相应的计算节点,这时你用pip install 某个安装包失败了。 解决方法是,可以先logout 计算节点,即退出计算结点,回到环境(pytorch_1.10)下再pip install 就可以了。

后续遇到问题会继续更新,感谢关注!!  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/94932.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PHP将PDF转图片-实战

Windows环境下 一、开启 Imagick 扩展 1、安装PHP扩展&#xff1a;Imagick&#xff0c;下载地址 https://pecl.php.net/package/imagick 注意和php版本保持一致&#xff1b; 2、将下载下来的文件解压&#xff0c;把php_imagick.dll复制到php/ext下&#xff0c;即php的扩展目…

【人脸识别】形态学教室人数统计(带面板)【含Matlab源码 1703期】

⛄一、人数统计简介&#xff08;附课程作业报告&#xff09; 1 课题背景 本课题为基于matlab的人数统计系统。近年来&#xff0c;很多行业对人流信息有极大的需求&#xff0c;如汽车公交站&#xff0c;地铁站台&#xff0c;商场出入口等。通过人数统计系统可以方便、可靠、实时…

5-6: Elasticsearch(入门安装)

Elasticsearch简介 一个分布式的&#xff08;多台服务器集群部署&#xff09;、Restful风格(设计风格&#xff0c;前后端交互的风格&#xff0c;请求标准的描述)的搜索引擎。支持对各种类型的数据的检索。搜索速度快&#xff0c;可以提供实时的搜索服务。便于水平扩展&#xf…

23.层和块

在构造自定义块之前&#xff0c;我们先回顾一下多层感知机 的代码。 下面的代码生成一个网络&#xff0c;其中包含一个具有256个单元和ReLU激活函数的全连接隐藏层&#xff0c; 然后是一个具有10个隐藏单元且不带激活函数的全连接输出层。 import torch from torch import nn …

是面试官放水,还是公司实在是太缺人?这都没挂,京东原来这么容易进...

“京东是大企业&#xff0c;是不是很难进去啊&#xff1f;”“在京东做软件测试&#xff0c;能得到很好的发展吗&#xff1f;一进去就有9.5K&#xff0c;其实也没有想的那么难”直到现在&#xff0c;心情都还是无比激动&#xff01; 本人211非科班&#xff0c;之前在字节和腾讯…

第04讲:Security之用户授权

一、创建项目 参考&#xff1a;浅试Security 二、实现用户授权 2.1、基于权限进行访问控制 hasAuthority方法&#xff1a;如果当前的主体具有指定的权限&#xff0c;则返回true&#xff0c;否则返回false。hasAnyAuthority方法&#xff1a;如果当前的主体有任何提供的权限的…

二叉树的前序-中序-后序遍历

在牛客网刷到了二叉树的遍历&#xff0c;二叉树的遍历分为前序遍历&#xff0c;前序遍历也有先序遍历之称&#xff0c;还有中序遍历&#xff0c;以及后序遍历&#xff0c;这么多种遍历&#xff0c;遍历的方式不一样而已&#xff0c;前序遍历是先遍历根然后左节点然后是右节点&a…

两年前端的2022:24岁、辗转三省、进入阿里

前言 前排声明&#xff1a;文中主人公不是博主&#xff0c;另外本文只是一些朋友在工作、生活上的经历和琐碎&#xff0c;想看技术干货的掘友请止步&#xff0c;不要在本文上浪费你的学习时间~~~ 2022年&#xff0c;也实实在在满24岁了&#xff0c;毕业进入社会两年多&#xff…

我与外企上司的四个职场故事

标题&#xff1a;我与外企上司的四个职场故事 我在目前这家任职的外企从事软件开发工作&#xff0c;已经整整十五年了。本系列文章通过介绍我与自己上司的四个职场小故事&#xff0c;想和大家分享在外企里&#xff0c;一个程序员除了埋头提升自己技术之外&#xff0c;还有哪些…

数据自动录入并生成报表神器怎么玩?

做报表、分析数据、做汇报是许多打工人的日常&#xff0c;每天都要耗费不少的时间用Excel来整理、清洗数据和生成好看的报表。如果这些数据都是手动整理、复制粘贴的话&#xff0c;不仅费时费力&#xff0c;而且很容易出错。 在越来越多企业采用SaaS产品和不同数据应用的今天&…

没有任何销售经验怎么进行销售团队管理?

没有任何销售经验想要进行销售团队管理&#xff0c;并不是一件容易的事情。每一行都有值得研究和学习的地方&#xff0c;需要学习补充的知识点还是比较多的。 参考《销售管理管理成长手册》&#xff0c;本文为您讲解以下管理知识&#xff0c;包括&#xff1a;1、明白销售经理是…

春招升级打怪拿offer,10w+字总结的Java面试题(附答案)够你刷

春招升级打怪拿offer&#xff0c;献上熬夜整理最新“10w字总结的Java面试题&#xff08;附答案&#xff09;”够你刷&#xff01; 其包含的内容模块有&#xff1a;基础、JVM、多线程与高并发、Spring、MyBatis、SpringBoot、MYSQL、SpringCloud、Dubbo、Nginx、MQ、数据结构与算…

libevent实战学习

目录 编译安装libevent libevent 事件对象 事件操作 事件循环 事件处理 libevent 客户端demo libevent 服务端demo libevent 服务端升级demo libevent完整demo 总结 C/CLinux服务器开发/后台架构师【零声教育】-学习视频教程-腾讯课堂 编译安装libevent git上下载h…

十分钟彻底搞懂python异常

异常 目标 异常的概念捕获异常异常的传递抛出异常 01. 异常的概念 程序在运行时&#xff0c;如果 Python 解释器 遇到 到一个错误&#xff0c;会停止程序的执行&#xff0c;并且提示一些错误信息&#xff0c;这就是 异常程序停止执行并且提示错误信息 这个动作&#xff0c;…

真无线耳机哪个品牌音质最好?半入耳式真无线蓝牙耳机推荐

对于社恐的人来说&#xff0c;出门在外都会选择佩戴上耳机&#xff0c;那么这种情况下&#xff0c;一款高品质的耳机真的是必不可少的&#xff0c;选择了一款性能优秀的耳机&#xff0c;不光能够让自己听音乐的过程中有更好的体验感&#xff0c;同时还能舒缓身心&#xff0c;让…

编程常见的问题(三) 线程池

编程常见的问题(三) 线程池 今天&#xff0c;我来讲讲使用线程池需要注意的一些问题。 在程序中&#xff0c;我们会用各种池化技术来缓存创建昂贵的对象&#xff0c;比如线程池、连接池、内存池。一般是预先创建一些对象放入池中&#xff0c;使用的时候直接取出使用&#xff…

[附源码]Node.js计算机毕业设计高校运动会管理系统Express

项目运行 环境配置&#xff1a; Node.js最新版 Vscode Mysql5.7 HBuilderXNavicat11Vue。 项目技术&#xff1a; Express框架 Node.js Vue 等等组成&#xff0c;B/S模式 Vscode管理前后端分离等等。 环境需要 1.运行环境&#xff1a;最好是Nodejs最新版&#xff0c;我…

阿里三面,mmap 没答好!

1、mmap基础概念 mmap 是一种内存映射文件的方法&#xff0c;即将一个文件或者其他对象映射到进程的地址空间&#xff0c;实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一映射关系。 实现这样的映射关系后&#xff0c;进程就可以采用指针的方式读写操作这一段内存&a…

给你30s,如何跟面试官讲清楚跳表

查找 假设有如下这样一个有序链表&#xff1a; 想要查找 24、43、59&#xff0c;按照顺序遍历&#xff0c;分别需要比较的次数为 2、4、6 目前查找的时间复杂度是 O(N)&#xff0c;如何提高查找效率&#xff1f; 很容易想到二分查找&#xff0c;将查找的时间复杂度降到 O(Lo…

MipNeRF:多尺度、抗混叠NeRF

Mip-NeRF: A Multiscale Representation for Anti-Aliasing Neural Radiance Fields ​ ICCV 2021 文章目录Mip-NeRF: A Multiscale Representation for Anti-Aliasing Neural Radiance Fields原始NeRF的问题重点componentsCone TracingIPE-integrated positional encodingPE与…