深度学习方法的发展是推动深度学习框架进步的最大动力,因此深度学习框架的功能和设计应顺应 算法和模型的发展趋势:
第一,易用性。深度学习领域仍处于快速发展期,参与者和学习者不断增加,新模型大量提出。因 此,与以往编程语言较为相似,且易于学习和编写的框架更容易受到使用者的青睐,有助于框架推广及获取更多用户。
第二,分布式与并行能力。随着深度学习模型规模及数据量的急剧增加,单卡已经无法满足较大模型的训练。分布式训练以及随之而来的并行问题对深度学习的重要性不断增加,尤其是对于工业界大型应用,如何提升并行和分布式性能,降低训练花费是当前及未来深度学习框架必须解决的问题。
第三,统一性。统一性包括纵向与横向的统一性,纵向统一性指的是框架各版本之间应在接口与使 用方法上保持一致,横向统一性则指框架对各类硬件及各类部署的统一性。由于深度学习框架更新迭代快,若各版本之间接口与用法不统一,会对使用者带来较大阻碍,TensorFlow正是由于缺乏纵向统一性而导致用户流失。而在横向统一性上,随着深度学习的广泛应用,模型已被部署在各类硬件上,除专业计算卡和计算机CPU、GPU 之外也越来越多的用于手机甚至耳机、摄像头等移动终端。多类型终端部署对框架的横向统一性提出了要求,具有良好横向统一性的框架能够使模型不经过特别调整即可部署在多个终端,大大简化了深度学习在工业界应用的步骤,提升了模型的实用性。
第四,扩展性。深度学习模型的发展与其他方法的交叉逐渐增加,模型不再是以往简单的神经网络 层堆砌和卷积等操作,图模型、贝叶斯等模型越来越多地与深度学习模型进行结合,可以预见未来将有更多模型与深度学习方法结合。一个良好的深度学习框架应具有对这些模型的支持,简化相关模型的编写。
第五,计算效率。训练耗时长是大型深度学习模型的主要缺点之一,训练耗时长不仅增加了训练花 费,并且增加了调试和开发的难度。在大模型盛行的当下,训练时长也在不断增加。因此,如何提高框架计算效率、降低运算时间,如何对线性代数计算进行优化和提高编译器性能,成为了深度学习框架未来的重要研究方向。
国内深度学习框架
PaddlePaddle
MindSpore
Oneflow
Jittor
MegEngine
从深度学习框架的发展历程与当前使用情况来看,呈现以下三个特点。
第一,深度学习框架处于快速发展阶段。目前,全球范围内深度学习框架主要由科技巨头公司推出, 美国公司产品推出较早,近年来中国公司也纷纷推出了自研框架加入竞争。不仅框架数量不断增加,各个框架自身也在快速迭代,版本和功能不断更新。与此同时,受市场欢迎的框架不断改变,一段时间内一个框架就可能从成功走向衰落,被新框架取代。因此,随着深度学习应用的进一步扩大,深度学习框架未来将迎来更加激烈的竞争和发展。
第二,新框架后发优势明显。从深度学习框架的流行趋势中可以发现,较早推出的框架虽然拥有更多的模型积累、广泛的用户使用、更成熟的社区环境等先发优势,但新框架仍能快速吸引用户,抢占市场。这是由于新框架从旧框架的不足中吸取经验,更好地适应深度学习发展的需要,而这些缺点往往需要框架从底层设计中进行改正。因此,新推出的框架有着精准解决用户痛点的后发优势。
第三,深度学习框架的竞争已超出公司层面。随着深度学习在工业界应用越发深入,对经济和产业发展的影响也越大,深度学习框架作为深度学习的“操作系统”,其发展也影响着国家科技经济的发展, 对经济高质量发展和经济转型具有重要意义。 当前,全球深度学习领域仍以美国公司的框架与硬件为主。在全球竞争更加激烈的背景下,中国的深度学习产业也面临着风险。只有发展中国自己的深度学习框架及计算芯片才能有效降低风险,对于深度学习使用者来说掌握一门中国深度学习框架也应成为必备技能。
相关的文章参考
几种信号降噪算法(第一部分)
https://www.toutiao.com/article/7190201924820402721/
几种信号降噪算法(第二部分)
https://www.toutiao.com/article/7190270349236683264/
机械故障诊断及工业工程故障诊断若干例子(第一篇)
https://www.toutiao.com/article/7193957227231855163/
知乎咨询:哥廷根数学学派
算法代码地址:mbd.pub/o/GeBENHAGEN
擅长现代信号处理(改进小波分析系列,改进变分模态分解,改进经验小波变换,改进辛几何模态分解等等),改进机器学习,改进深度学习,机械故障诊断,改进时间序列分析(金融信号,心电信号,振动信号等)