Deeplearning4j【基础 01】初识Java深度学习框架DL4J

news2024/10/22 12:25:48

初识Java深度学习框架DL4J

  • 1.起因
  • 2.简介
  • 3.组件
    • 3.1 Deeplearning4j/ScalNet
      • 3.1.1 Deeplearning4jf(Java)
      • 3.1.2 ScalNet(Scala)
    • 3.2 ND4J/LibND4J
    • 3.3 SameDiff
    • 3.4 DataVec
    • 3.5 Arbiter
    • 3.6 RL4J
  • 4.总结

内容来自网络,基于官方文档【 Deeplearning4j】、知乎【 DL4J开发者社区】、OSCHINA【 Deeplearning4j 分布式深度学习库】、科普中国·科学百科【 Deeplearning4j】等文章进行整理,简化了一些信息并通过深度学习菜鸟 我这个人形GPT〒_〒的思维方式进行阐述。

1.起因

  • LLM如火如荼地影响着整个互联网应用,AI也成为焦点,之前的大数据分析似乎热度过去了,大家都想学点儿ML,但是Python、GPU不是都具备的。
  • DL4J可以在JVM上运行,拥有了Java语言的一切优点,且支持GPU和大数据组建集成,不用担心性能和可扩展性。
  • 由于是小白,需要进行基础知识的补充,这里整理一下分享给大家。

2.简介

Deeplearning4j是当前最大、最流行的基于JAVA的深度学习框架,正式诞生于2013年,在2017年加入Eclipse基金会,由美国的Skymind开源并维护。

  • 支持神经网络模型的构建、模型训练和部署;
  • 能够与现有大数据生态进行无缝衔接(Hadoop、Spark等),也是可以原生态支持分布式模型训练的框架之一;
  • 支持多线程;
  • 跨平台(硬件:CUDA GPU,x86,ARM,PowerPC;操作系统:Windows/Mac/Linux/Android)。

小结一下:模型构建、模型训练和部署一条龙,兼容性强,多线程,跨平台(特别注意Android平台,支持端侧模型)?

3.组件

Deeplearning4j实际上是一堆项目,旨在支持基于 JVM 的深度学习应用程序的所有需求。除了 Deeplearning4j 本身(高级 API),它还包括:

  • Deeplearning4j/ScalNet:JVM和Spark上运行神经网络构建、训练和部署的基础框架库;
  • ND4J/libND4J:支持CPU/GPU加速的高性能数值计算库,可以说是JVM上的Numpy;
  • SameDiff:用于符合微分和计算图库;
  • DataVec:数据处理库,提供采样、过滤、变换等操作;
  • Arbiter:神经网络超参数搜索和优化库;
  • RL4J:JVM上的强化学习库;
  • Model Import:模型导入库,可以导入ONNX,TensorFlow,Keras(Caffe)模型;
  • Jumpy:ND4J对应Python语言API;
  • Python4j:可以在JVM里运行Python脚本语言。

dl4j-0.jpg
dl4j-3.jpg

3.1 Deeplearning4j/ScalNet

  1. 前向神经网络(Feedforward Neural Networks, FNN)
  2. 自动编码器(AutoEncoders)
  3. 卷积神经网络(Convolutional Neural Networks, CNN)
  4. 循环神经网络(Recurrent Neural Networks ,RNN)
  5. 生成对抗网络(Generative Adversarial Networks)
  6. 递归神经网络(Recursive Neural Network )
  7. 深度信念网络(Deep Belief Networks)和受限制玻尔兹曼机(Restricted Boltzmann Machines)
  8. 图神经网络(Graph Neural Networks)

dl4j-1.jpg

3.1.1 Deeplearning4jf(Java)

神经网络高层API库,用于构建具有各种层的多层神经网络(MultiLayerNetworks)和计算图(ComputationGraphs),支持从其他框架导入模型和在Apache Spark上进行分布式训练

3.1.2 ScalNet(Scala)

ScalNet是受Keras启发而为Deeplearning4j开发的Scala语言包装。它通过Spark在多个GPU上运行。功能相当于Keras。
Keras是一个由Python编写的开源人工神经网络库,可以作为Tensorflow、Microsoft-CNTK和Theano的高阶应用程序接口,进行深度学习模型的设计、调试、评估、应用和可视化。

3.2 ND4J/LibND4J

ND4J是Deeplearning4j的数值处理库和张量库,在JVM中实现Numpy的功能:

  • Java科学运算引擎,用来驱动矩阵操作;
  • JavaCPP功能: Java 到 Objective-C 的桥,可像其他 Java 对象一样来使用 Objective-C 对象;
  • CPU 后瑞:OpenMP、OpenBlas 或 MKL、与SIMD的扩展;
  • GPU 后瑞:最新CUDA 及 CuDNN。

包含500多种数学、线性代数和神经网络操作。

3.3 SameDiff

SameDiff是具有自动微分功能的张量计算库,其自动微分方法是基于静态图的方法,提供神经网络运算中更为底层的接口,主要用于自定义神经网络拓扑结构。
另外,SameDiff支持导入Tensorflow冻结模型格式的.pd(protobuf)模型。对ONNX、TensorFlow SaveModel和Keras模型的导入正在完善中。可以简单的认为SameDiff和DL4J的关系类似于Tensorflow和Keras。
符合微分和计算图库是深度学习中的两个关键概念:

  1. 符合微分(Automatic Differentiation,简称AD)
  • 符合微分是一种计算梯度的技术,用于优化神经网络中的参数。
  • 在神经网络训练过程中,我们需要计算损失函数对模型参数的梯度,以便使用梯度下降等优化算法来更新参数。
  • 符合微分通过构建计算图并自动计算每个节点的梯度,使得梯度计算变得高效且不容易出错。
  • 常见的深度学习框架(如TensorFlow、PyTorch和Deeplearning4j)都使用符合微分来实现反向传播算法。
  1. 计算图库
  • 计算图是一种表示复杂计算过程的图结构,其中节点表示操作(例如加法、乘法、激活函数等),边表示数据流。
  • 计算图库用于构建、管理和执行计算图。
  • 在深度学习中,计算图用于描述神经网络的前向传播和反向传播过程。

3.4 DataVec

神经网络专门处理多维数组形式的数值数据。DataVec可以将来自一个CSV文件或一批图像的数据序列化,转换为数值数组。数据的摄取、清理、联接、缩放、标准化和转换是开展任何类型的数据分析时都必须完成的工作。是深度学习的先决条件。DataVec是专为这一流程设计的工具包。数据科学家和开发人员可以用其中的工具将图像、视频、声音、文本和时间序列等原始数据转变为特征向量,输入神经网络。

  • 数据的的 ETL (抽取、转换、装载)和向量化;
  • DataVec帮助克服机器学习及深度学习实现过程中最重大的障碍之一:将数据转化为神经网络能够识别的格式;
  • DataVec使用Apache Spark来进行转换运算。

整体流程如下:

image.png
同时,DataVec也支持所有主要类型的输入(CSV、文本、图像、音频、视频和数据库)整体流程如下:


除了明显提供经典数据格式的读取器,DataVec还提供了一个接口用来摄取特定的自定义数据。

3.5 Arbiter

Arbiter帮助您搜索超参数空间,为神经网络寻找最理想的参数组合及架构。这非常重要,因为寻找恰当的架构和超参数是一个很大的组合问题。来自微软研发部等企业实验室的ImageNet大赛获胜团队正是通过搜索超参数空间才得出了ResNet这样的150层神经网络:

  • 深度学习模型检测、评估器;
  • 调整及优化机器学习模型;
  • 使用Grid search和Random Search 作超参数寻优;
  • arbiter-core:Aribter-core用网格搜索等算法来搜索超参数空间。它会提供一个GUI界面。
  • arbiter-deeplearning4j:Arbiter可以同DL4J模型互动。在进行模型搜索时,您需要能运行模型。这样可以对模型进行试点,进而找出最佳的模型。

3.6 RL4J

RL4J是在Java中实现深度Q学习、A3C及其他强化学习算法的库和环境,与DL4J和ND4J相集成。

4.总结

简而言之,Deeplearning4j 能够让你从各类浅层网络(其中每一层在英文中被称为layer)出发,设计深层神经网络。这一灵活性使用户可以根据所需,在分布式、生产级、能够在分布式 CPU 或 GPU 的基础上与 Spark 和 Hadoop 协同工作的框架内,整合受限玻尔兹曼机、其他自动编码器、卷积网络或递归网络。此处为我们已经建立的各个库及其在系统整体中的所处位置:

dl4j-4.jpg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1498693.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

20240304-使用VS2022编译blender3.6.2源代码

20240304-使用VS2022编译blender3.6.2源代码 一、软件环境 Win10 x64 22h2 JuneVS2022 v17.9.0CMake v3.24.4SVN v1.14.3GIT v2.29.2标签:win10 22h2 vs2022 blender 63335分栏:C 二、硬件环境 Win10 x64的PC台式机 三、获取源码 方法一 网盘下载…

龙蜥社区成立系统安全 SIG,助力系统安全生态

随着数字化时代的到来,云计算、大数据、人工智能等技术的广泛应用,操作系统承载越来越多的关键业务和数据,其安全性对于信息系统的运转和发展具有至关重要的作用。因此,加强操作系统安全防护、提高安全意识和防范能力是数字化时代…

php常见的45个漏洞及解决方案

[TOC](太多了,目录只列出最重要的几个,剩下的同学们自己翻) PHP作为一种广泛应用的服务器端脚本语言,在历史上曾曝出过多种安全漏洞。以下是一些PHP漏洞的类别及其简要解释,以及如何解决这些问题&#xff1…

看一看阿里云,如何把抽象云概念,用可视化表达出来。

云数据库RDS_关系型数据库 云数据库RDS_关系型数据库 专有宿主机 云数据库RDS_关系型数据库_MySQL源码优化版 内容协作平台CCP-企业网盘协同办公-文件实时共享

LT6813/ADBMS1818底层驱动---均衡控制

1、LT6813采用内部均衡的原理 2、平衡控制结构体 根据数据库中读取的控制值设置平衡。要为单元设置平衡,必须将相应的位写入配置寄存器中。LTC 驱动程序仅执行数据库中 BMS 写入的数据。 参数 ltc_stateLTC 状态机的状态pSpi接口指向 SPI 配置的指针pTxBuff &…

【nodejs】“__dirname is not defined”错误修复

▒ 目录 ▒ 🛫 问题描述环境 1️⃣ 原理CommonJS vs ESM错误原因 2️⃣ 禁用 ESM 模式并改用 CommonJS方案一:项目方案二:单文件 3️⃣ 在 ESM 模式下自实现__dirname📖 参考资料 🛫 问题 描述 从网上找了一份代码&am…

O2O:Offline Meta-Reinforcement Learning with Online Self-Supervision

ICML 2022 paper Introduction 元强化学习(Meta RL)结合O2O。元RL需要学习一个探索策略收集数据,同时还需学习一个策略快速适应新任务。由于策略是在固定的离线数据集上进行元训练的,因此在适应探索策略收集的数据时,它可能表现得不可预测&…

Tomcat源码解析(三):LifeCycle生命周期管理

Tomcat源码系列文章 Tomcat源码解析(一):Tomcat整体架构 Tomcat源码解析(二):Bootstrap和Catalina Tomcat源码解析(三):LifeCycle生命周期管理 目录 前言一、LifeCycle接口1、接口介绍2、生命周期状态 二、LifecycleBase抽象类1、监听器2、…

JavaEE之volatile关键字

一.内存可见性问题 什么是内存可见性问题 计算机运行的程序/代码,往往需要访问数据。这些数据往往存在于内存中。 cup使用此变量时,就会把内存中的数据先读出来,加载到cpu寄存器中,再去参与运算。 但是,关键是cpu读…

opengl 学习(三)-----着色器

着色器 分类demo效果解析教程 分类 OPengl C demo #include "glad/glad.h" #include "glfw3.h" #include <iostream> #include <cmath> #include <vector>#include <string> #include <fstream> #include <sstream>…

Spring源码:手写AOP

文章目录 一、概念1、AOP是什么&#xff1f;2、相关概念1&#xff09;目标对象Target2&#xff09;通知Advice3&#xff09;连接点Joinpoint4&#xff09;切点Pointcut5&#xff09;切面Aspect6&#xff09;织入Weaving 二、分析三、实现1、实现Advice1&#xff09;前置通知2&a…

IDEA中新增文件,弹出框提示是否添加到Git点错了,怎么重新设置?

打开一个配置了Git的项目&#xff0c;新增一个文件&#xff0c;会弹出下面这个框。提示是否将新增的文件交给Git管理。 一般来说&#xff0c;会选择ADD&#xff0c;并勾选Dont ask agin&#xff0c;添加并不再询问。如果不小心点错了&#xff0c;可在IDEA中重新设置&#xff08…

经典语义分割(二)医学图像分割模型UNet

经典语义分割(二)医学图像分割模型UNet 我们之前介绍了全卷积神经网络( FCN) &#xff0c;FCN是基于深度学习的语义分割算法的开山之作。 今天我们介绍另一个语义分割的经典模型—UNet&#xff0c;它兼具轻量化与高性能&#xff0c;通常作为语义分割任务的基线测试模型&#x…

海格里斯HEGERLS助力服装业领域数智化转型 配备7000个托盘位 仓库容量增超110%

近年来&#xff0c;用工荒成为服装制造行业的一大痛点。对此&#xff0c;整个生产体系就要不断地向智能化、自动化生产设备进行转型&#xff0c;甚至在研发设计上都要面向自动化做一些新一代服装制造业的开发。 作为较早入局物流赛道的河北沃克&#xff0c;目前已构建起以AI赋能…

P2241 统计方形(数据加强版) python解法

求n*m网格内矩形的数目 - tenos - 博客园 (cnblogs.com) 法一&#xff08;题解推规律暴力枚举得到&#xff09;&#xff1a; n,mmap(int,input().split()) sqr,rec0,0 #正方形和长方形个数 #以长宽做循环&#xff0c;每次求n*m大小的矩形的个数 #题解是从0开始的&#xff0c;我…

Java二级--操作题详解(1)

目录 1.第一套&#xff1a; 1.1 基本操作&#xff1a; 1.2 题解分析&#xff1a; 2.1 简单应用&#xff1a; 2.2 解题分析&#xff1a; 3.1 综合应用&#xff1a; 3.2解题分析&#xff1a; 1.第一套&#xff1a; 1.1 基本操作&#xff1a; 在考生文件夹中存有文件名为J…

浅析扩散模型与图像生成【应用篇】(八)——BBDM

8. BBDM: Image-to-Image Translation with Brownian Bridge Diffusion Models 本文提出一种基于布朗桥&#xff08;Brownian Bridge&#xff09;的扩散模型用于图像到图像的转换。图像到图像转换的目标是将源域 A A A中的图像 I A I_A IA​&#xff0c;映射到目标域 B B B中得…

【重要!!退税!退税!】一年一度个人所得税综合年度汇算开始了!

目录标题 如何退税&#xff1f;2023年度个人所得税综合所得汇算清缴操作指南汇算准备标准申报 退税骗局&#xff1f;1.“您有一笔退税待领取”骗局2.“专业人员帮你多退税”骗局3.“诱导填报虚假个税信息”骗局4.“税务稽查人员联系你”骗局 如何退税&#xff1f; 2023年度个人…

【elementplus】el-image图片预览的显示不全问题(和el-table、el-dialog组合使用时)

问题&#xff1a; 在和el-table、el-dialog组合使用时&#xff0c;el-image图片预览的时候&#xff0c;会可能出现显示不全图片的情况。 解决方法&#xff1a; <el-image-viewer:z-index"3000":teleported"true"/>element文档中有属性&#xff1a;…

【SpringBoot3.x教程03】SpringBoot自动配置详解

前言&#xff1a;什么是自动配置 自动配置的原理 Spring Boot自动配置尝试根据添加到项目中的jar依赖、定义的bean以及各种属性设置来自动配置Spring应用。这是通过EnableAutoConfiguration注解实现的&#xff0c;该注解通常是通过SpringBootApplication注解间接应用的。Spring…