DeePMD-kit 配置环境备忘

news2024/10/6 20:38:07

版本

在这里插入图片描述
在这里插入图片描述

Conda

Conda是一个开源的包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖项,并在它们之间轻松切换。它可以在Linux、OS X和Windows上运行,是为Python程序创建的,但可以打包和分发任何软件。

conda enactivate
conda activate database
conda create -n database python=3.6
conda env list  / conda info --env    #查看共有多少个小环境

conda安装与使用: https://zhuanlan.zhihu.com/p/397096022

Tensorflow

检测tensorflow是否能正常运行:

python
import tensorflow as tf
tf.test.gpu_device_name()

无效报错:
在这里插入图片描述
在这里插入图片描述

CuDNN

CuDNN(CUDA深度神经网络)是由NVIDIA开发的库,提供GPU加速的深度神经网络基元。它旨在为TensorFlow、PyTorch、Caffe、CNTK等深度学习框架提供高性能的构建块。

CuDNN包括各种卷积神经网络(CNN)、循环神经网络(RNN)和其他深度学习模型的算法和优化。它还支持多种精度模式,包括单精度(FP32)、半精度(FP16)和混合精度(FP16/FP32)。

使用CuDNN可以显著加速在NVIDIA GPU上训练和推断深度神经网络。它被广泛应用于工业和学术界的各种深度学习应用,包括计算机视觉、自然语言处理、语音识别等。


ubuntu上的cudnn安装及使用报错解决办法: https://blog.csdn.net/qq_35284836/article/details/104630331?spm=1001.2014.3001.5506

Ubuntu20.04安装cuDNN(包括WSL):https://blog.csdn.net/leiconghe/article/details/128037529?spm=1001.2014.3001.5506

WSL2安装CUDA报错:The public CUDA GPG key does not appear to be installed. https://blog.csdn.net/qq_39910747/article/details/125161926


 sudo dpkg -i cudnn-local-repo-ubuntu2004-8.5.0.96_1.0-1_amd64.deb
 sudo cp /var/cudnn-local-repo-ubuntu2004-8.5.0.96/cudnn-local-0579404E-keyring.gpg /usr/share/keyrings/cuda-archive-keyring.gpg
sudo dpkg -i cudnn-local-repo-ubuntu2004-8.5.0.96_1.0-1_amd64.deb
sudo apt-get update
cd /var/cudnn-local-repo-ubuntu2004-8.5.0.96/
sudo dpkg -i libcudnn8_8.5.0.96-1+cuda11.7_amd64.deb
sudo dpkg -i libcudnn8-dev_8.5.0.96-1+cuda11.7_amd64.deb
sudo dpkg -i libcudnn8-samples_8.5.0.96-1+cuda11.7_amd64.deb

(deepmd) chen@LAPTOP-RKMEQUBF:~/workplace$ cp -rv /usr/src/cudnn_samples_v8 .
(deepmd) chen@LAPTOP-RKMEQUBF:~/workplace/cudnn_samples_v8/mnistCUDNN$ make clean
(deepmd) chen@LAPTOP-RKMEQUBF:~/workplace/cudnn_samples_v8/mnistCUDNN$ make -j4
(deepmd) chen@LAPTOP-RKMEQUBF:~/workplace/cudnn_samples_v8/mnistCUDNN$ make -j4
(deepmd) chen@LAPTOP-RKMEQUBF:~/workplace/cudnn_samples_v8/mnistCUDNN$ make -j4
(deepmd) chen@LAPTOP-RKMEQUBF:~/workplace/cudnn_samples_v8/mnistCUDNN$ ./mnistCUDNN

sudo cp /usr/include/cudnn.h /usr/local/cuda-11.6/include/
sudo cp /usr/lib/x86_64-linux-gnu/libcudnn.so /usr/local/cuda-11.6/lib64/
sudo cp /usr/lib/x86_64-linux-gnu/libcudnn.so.8 /usr/local/cuda-11.6/lib64/
sudo cp /usr/lib/x86_64-linux-gnu/libcudnn.so.8.5.0 /usr/local/cuda-11.6/lib64/
cd /usr/local/cuda-11.6/lib64
sudo chmod 777 libcudnn*

Horovod

Horovod是由Uber开源的分布式深度学习框架,旨在加速大规模模型训练。它可以在多个GPU或多个机器之间快速、高效地并行训练。

Horovod支持TensorFlow、PyTorch、MXNet和Keras等多个深度学习框架,并提供了一些高级功能,如弹性训练、动态调整学习率和容错机制等。它还支持多种通信协议,包括TCP、MPI和RDMA等,以适应不同的部署环境和硬件架构。

使用Horovod可以显著提高深度学习模型的训练速度和规模,特别适用于大规模数据和复杂模型的训练。它已经被广泛应用于工业和学术界的各种深度学习任务,如图像分类、目标检测、自然语言处理等。

mpi4py

mpi4py是一个用于Python编程语言的MPI(Message Passing Interface)通信库,它可以让Python程序在多个进程之间进行并行计算。

MPI是一种广泛用于分布式内存并行计算的通信标准,它允许多个进程在不同的计算节点之间进行通信和同步。mpi4py提供了Python语言的MPI接口,使得Python程序员可以方便地使用MPI实现并行计算。

mpi4py支持多种MPI实现,包括OpenMPI、MPICH和Intel MPI等。它提供了一些高级功能,如非阻塞通信、组通信和拓扑通信等,同时也支持NumPy数组和Python对象的通信。

使用mpi4py可以方便地在Python中实现大规模并行计算,特别适用于科学计算、数据分析和机器学习等领域。它已经被广泛应用于学术界和工业界的各种科学计算任务。

MPI:

sudo apt install mpich

在这里插入图片描述

Other

vim ~/.bashrc
export PATH="/usr/local/mpich-3.3.2/bin:$PATH"  
source ~/.bashrc 

which find locate

update-alternatives: using /usr/include/x86_64-linux-gnu/cudnn_v8.h to
provide /usr/include/cudnn.h (libcudnn) in auto mode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/416210.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

为何ChatGPT如此擅长编造故事?

“幻觉”——人工智能中的一个偏见性术语 AI聊天机器人(如OpenAI的ChatGPT)依赖于一种称为“大型语言模型”(LLM)的人工智能来生成它们的响应。LLM是一种计算机程序,经过数百万文本源的训练,可以阅读并生成“自然语言”文本语言,就像人类自然…

TCP报头结构和TCP协议特性

TCP报头结构 原端口号/目的端口号:表示数据是从哪个进程来,到哪个进程去; 32位序号/32位确认号:这个序号是取的发送方发送所用数据下一个字节的序号,发送方的序列号和接收方的确认号一样,才算接收成功&…

敏捷开发模式下如何用 PingCode 这类工具进行版本发布管理

在软件团队工作中,版本发布要达到好的发布效果,需要在版本发布前做好版本发布的规划,并对发布流程和进度进行管理 准备工作: 您已经创建了一个 PingCode 帐户【快速注册入口】 您创建了一个 PingCode Scrum或 Kanban 项目 您的…

【周末闲谈】文心一言,模仿还是超越?

个人主页:【😊个人主页】 系列专栏:【❤️周末闲谈】 周末闲谈 ✨第一周 二进制VS三进制 文章目录周末闲谈前言一、背景环境二、文心一言?(_)?三、文心一言的优势?😗😗😗四、文心一…

使用 arm 架构实例搭建 Harbor

使用 arm 架构实例搭建 Harbor事情准备(使用甲骨文云上实例时的准备事项)第1步,准备自签名证书第2步,安装Docker-ce第3步,构建arm镜像第4步,安装Harbor第5步,访问Harbor第6步,上传镜…

TensorFlow 深度学习第二版:1~5

原文:Deep Learning with TensorFlow Second Edition 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自【ApacheCN 深度学习 译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。 不要担心自己的形象,只…

2023年【第十四届蓝桥杯】省赛java b组填空题

第一题 令 S 1! 2! 3! ... 202320232023!,求 S 的末尾 9 位数字。 提示:答案首位不为 0。 考试时的想法以及题解: 如果我们直接按照题目描述直接来求每个阶乘和的话恐怕没有什么数据类型能够胜任,在考试时我一开始使用了…

Linux中的read/write和recv/send的区别,并使用recv/send实现简单的聊天功能

Linux中的read/write和recv/send的区别read/writeread/writeread/write的用法recv/sendrecv/sendrecv/send的用法LinuxLinuxLinux中的read/writeread/writeread/write和recv/sendrecv/sendrecv/send的区别下面是一个使用read/write进行文件读写操作的例子:下面是一个…

【云原生】Kubernetes(k8s)部署 MySQL+Dubbo+Nacos服务

一、说明二、部署 MySQL三、部署 Nacos四、部署 Dubbo 服务4.1. 创建镜像仓库的密钥4.2. 部署 provider 服务4.3. 部署 consumer 服务五、测试一、说明 本文介绍基于 Kubernetes(k8s) 环境集成阿里云 私有镜像仓库 来部署一套 Dubbo Nacos 的微服务系统,并使用 Ku…

VUE前端项目环境搭建

背景: 想要使用vue搭建一个前端项目,写个小网站练练手,因为没有前端经验,所以从网上找了一个vue得开源模板使用,经过一番挑选选中了字节公司花裤衩大佬开源得项目,地址如下: 开源项目地址&…

第三代api自动化测试框架使用教程(pytest+allure+sql+yaml)

使用教程一、配置1、环境配置2、框架配置3、启动入口二、用例编写1、用例模板2、参数依赖写法2、函数(方法插件)写法3、接口上传文件和表单参数4、接口上传json参数5、接口无数据填写6、code断言7、body断言7、json断言8、sql断言9、完整断言写法&#x…

三种不同实现ublk的零拷贝I/O的方法

用户态块设备ublk,就是提供/dev/ublkbX这样的标准块设备给业务,业务读写这个块的实际IO处理由编写的用户态的代码决定。这就好比使用FUSE,所有对挂载于FUSE的目录的读写都是编写的IO handler来处理一样。使用用户态块设备,可以方便…

产品经理必读|用户研究方法总结①

众所周知,理解用户需求,识别用户痛点,是产品或功能成型之前绕不开的过程。而要获取到用户真实的需求和痛点,唯一的方法就是做用户调研。而用研的方法都有哪些呢?今天我就来给大家分享一下行业中常见的用研方法。 用研的…

ESP32设备驱动-VL53L0X飞行时间(激光测距)传感器驱动

VL53L0X飞行时间(激光测距)传感器驱动 文章目录 VL53L0X飞行时间(激光测距)传感器驱动1、VL53L0X介绍2、硬件准备3、软件准备4、驱动实现1、VL53L0X介绍 VL53L0X 是新一代飞行时间 (ToF) 激光测距模块,采用当今市场上最小的封装,与传统技术不同,无论目标反射率如何,都能提…

项目中开发固定表头和首列的表格【付代码】

前言 前段时间做移动端的项目,项目中需要一个固定表头和首列的表格,但由于是移动端的,组件库里没有类似的,于是,就去网上找看有没有类似的,结果越找越气,10个文章9个抄,抄也行&#…

安全狗入选网络安全行业全景图(第十版)多个细分领域

4月7日,安全牛正式发布第十版网络安全行业全景图。 作为国内云原生安全领导厂商,安全狗也凭借综合的安全能力脱颖而出入选全景图多个领域。 据悉,全景图报告调研基于企业自主申报,并对申报企业收录有严格要求,安全牛…

Zookeeper集群+Kafka集群

目录 一、Zookeeper Zookeeper 概述 定义 工作机制 Zookeeper特点 Zookeeper数据结构 ZooKeeper应用场景 统一命名服务 统一配置管理 统一集群管理 服务器动态上下线 软负载均衡 第一次启动选举机制 非第一次启动选举机制 二、部署Zookeeper集群 1、实验准备 2…

第60章 用户增、修、删的前端实现

1 \src\components\Users\AddUser.vue <template> <!-- elmentUI 子页面的渲染显示注意事项说明&#xff1a; 子页面的渲染显示必须的使用“<el-dialog></el-dialog>标签及其所包含的子标签&#xff0c;否则子页面将不会被渲染显示出来。” --> <…

Python学习笔记--判断语句

&#xff08;一&#xff09; 布尔类型和比较运算符 1. 布尔类型&#xff1a;判断结果 True&#xff1a;表示真&#xff08;是、肯定&#xff09; False&#xff1a;表示假&#xff08;否、否定&#xff09; """ 演示布尔类型的定义 以及比较运算符的应用 "…

BCM系统组成及控制原理

1 输入控制 由于负载能力、抗干扰能力等客观情况。许多信号量无法直接施加至MCU之上&#xff0c;须有适当的输入电路(Input circuit)将信号进行隔离、调理&#xff0c;方可安全可靠地传递给MCU。 下面以开关信号和脉冲信号2种来分述。 1)开关信号的输入。 即将系统与电源正…