研发/IT工程师双视角测评8大仿真平台,结果……

news2024/11/18 3:27:37

上一篇,我们围绕着亿万研发工程师的梦想,考察了市面上几乎所有类型的工业仿真平台,深度评测了他们本质究竟是什么适用场景有哪些分别能给研发和IT工程师们减轻多少工作量。

据此,我们搭建了一个工业仿真平台【心累指数】金字塔模型

戳这里回顾金字塔模型与基本设定:八大类主流工业仿真平台【心累指数】终极评测(上)

不同厨房/餐厅设定对应着同一层级不同“仿真平台”的本质属性,详细展开可以戳上面的链接。

总之,从金字塔底层到塔尖,不论是对研发还是IT工程师,都是站得越高,用得越爽

在上篇里,我们从基础定义与适用场景出发,讨论了8种平台/方案的产品模式、兼容性、支持的CAE仿真软件、底层资源量与类型、计费模式等信息。

今天,我们将更进一步,从研发和IT工程师的双视角用户体验出发,一起看看这8种平台/方案究竟是如何提升研发效率降低IT工作量的?

研发视角:如何提升研发效率

3.1、需要研发掌握什么技能?

底层:

自己买机器,研发+IT需要联合搞定包括但不限于软件、系统、硬件行情、机房选址、网络配置、IT运维、数据安全、集群调度……等事情。自家IT的能力越强,研发就相对轻松,反之就更心累。

超算中心需要研发点亮部分IT技能

特别是超算中心大多使用Linux系统,要求研发掌握一定的Linux常识才能上手。

贴一张超算的实际运行界面,大家感受一下⸺

云厂商同样需要研发点亮部分IT技能。但是云厂商可同时提供Windows和Linux的若干版本供用户选择,只不过带Windows系统的云资源普遍要比带Linux系统的贵。

中层:

这一层属于第三方平台,用户没有接触底层资源的权限,自然也不需要有太多IT技能。但这也代表着,很多东西是不能轻易改动的。

如果遇到使用上的问题,一般需要呼唤第三方平台的人来协助。自家IT可能帮不了太多。

塔尖:

针对研发与IT之间的交叉领域,我们的一整套端到端的仿真研发环境将很多IT工作自动化操作,大大减少了交叉领域的工作难度和工作量。另外,还有fastone的R&D-IT团队还可以提供全方位的服务支持。

fastone在支持Windows的同时,也可支持用户在Linux系统中使用图形化界面操作仿真任务,你只需熟悉一下Linux的常用操作与工具(如浏览器、文本编辑器),即可在很短的时间内上手,操作习惯几乎无需改变。

详请可戳:怎么把需要45天的突发性Fluent仿真计算缩短到4天之内?

3.2、是否包含前后处理+求解等一整套完整功能?

底层:

买机器,系统环境都需要自己部署,更别提软件功能了,一切都要靠自己

超算中心和云厂商绝大多数只支持计算求解

中层:

你可在软件平台中直接点击进入相关步骤,完成前后处理和计算求解

其他平台主要集中在计算求解这一环节。

塔尖:

同时包含前后处理+计算求解

3.3、可以图形化界面操作吗?

底层:

均无。

中层:

云厂商的仿真平台不支持。

部分硬件厂商的仿真平台可支持图形界面

超算云做了类似电脑桌面的界面,所有服务(包括SSH、上传下载,应用等)都可以在图形界面上操作。

软件平台一般完美支持

塔尖:

fastone针对不同的用户,提供多种任务提交方式以供选择。

图形界面模式:可通过Web浏览器启动集群,跳转到虚拟桌面,并可在该桌面直接操作应用进行相应设置以开启云端仿真任务。

任务模式:用户可以通过Web浏览器选择新建任务、选择应用、上传文件、输入参数、配置资源等一系列向导式路径提交任务。

集群模式:对于高级用户,比如本身对应用工作流的理解和编程能力超强,可以不用走普通用户通过应用向导式提交的路径,可以直接根据自己写的脚本,通过Web浏览器选择新建集群,然后按需动态地在云端创建HPC集群。

3.4、突然有个紧急项目,我能不能马上用上?

底层:

买机器响应时间最长,采购、运输、调试、部署环境、安装软件一套流程走下来,黄花菜都凉了。

超算中心需要排队,基本不可能满足紧急需求

云厂商可以较快地拿到资源,但配置环境、安装软件也需要时间。

中层:

除了超算云依然面临排队问题,在资源需求量不大的情况下,其他三个平台理论上均能较快地拿到资源并开始计算

塔尖:

快速启动,开即用。

尤其是当这个紧急项目需要非常多的算力时,fastone云平台的全球数据中心能持续稳定地提供用户所需资源类型及数量,分钟级调度开启上万核计算资源,满足业务紧迫度。

3.5、自动化程度有多高?

自动化是什么意思?

不需要你一台台地开机器,鼠标简单点几下就能自动开关机;

能够自定义工作流程,不需要每次跑仿真都重复设定;

自动检查任务状态,出现错误可以及时重复提交并通知你;

甚至对于某些因资源类型报错的任务,还能自动定位并调度其他类型的资源来跑任务……

底层:

均无。

中层:

均无。

塔尖:

fastone云平台可提供包括自动化部署、自定义工作流、自动检查任务状态与重复提交、自动定位任务并调度其他类型资源重算等IT自动化能力与Auto-Scale自动伸缩等功能,可快速全面地提升仿真研发效率。

比如我们的Auto-Scale功能可以自动监控用户提交的任务数量和资源的需求,动态按需地开启所需算力资源。在资源不够的时候,还能根据不同的用户策略,自动化调度本区域及其他区域的目标类型或相似类型实例资源。

效果怎么样?看这篇:从4天到1.75小时,如何让Bladed仿真效率提升55倍?

3.6、当有多个仿真任务时,是否支持开多台机器同时跑任务?

多个任务同时在数台机器上跑,这个我们称之为并行计算,一般都需要有调度器的参与。

关于调度器的相关知识,看这里:亿万打工人的梦:16万个CPU随你用

这么多机器,这么多任务,怎么顺利一一配置、启动、关闭,提高整体资源利用率,最好还能自动化管理等等,难度就陡然提升了。

对研发来说,能否支持大规模并行计算,是提升研发效率的关键。

底层:

买机器需要自己搞定一切。

超算中心和云厂商则是为你提供了一个基础架构,只要应用支持,你就可以进行并行计算。

中层:

同样在应用支持的前提下,金字塔中层可以让用户较为方便地进行并行计算。

不过这一层平台提供的只是基础环境,用户能否用好取决于其自身技术能力。

塔尖:

我们自主研发的云原生国产化调度器Fsched,可分钟级自动化调度上万核计算资源,帮助用户应对突发算力需求场景。更重要的是,fastone能够结合业务特点以及应用特性,利用计算机技术提升不同业务场景的计算效率。

举个栗子:这样跑COMSOL,是不是就可以发Nature了

3.7、能否提供任务监控及相应的告警、优化分析功能?

研发工程师关心的主要是自己的任务情况。

底层:

均无。

中层:

均无。

塔尖:

这方面fastone云平台可谓一枝独秀。

我们能多维度监控任务状态,提供基于任务层的监控、告警、数据统计分析功能与服务

有啥用呢?戳这两篇了解:

王者带飞LeDock!开箱即用&一键定位分子库+全流程自动化,3.5小时完成20万分子对接

Auto-Scale这支仙女棒如何大幅提升Virtuoso仿真效率?

3.8、仿真文件那么大,数据传输效率跟得上吗?

底层:

买机器如果是在本地进行数据传输,取决于本地网络配置。如果是多地传输,就看你买多大的带宽了。

超算中心对外的网络带宽十分有限,且被很多并发用户共享,数据传输是个大问题,人肉送硬盘有时甚至是最好的解决方案。

云厂商对结果数据支持直接读取,云上存储,按需下载。但怎么用,能不能用好,还是取决于用户自己。

中层:

超算云有专线网络,传输效率优于超算中心

其他三者的传输效率视自身机房条件/资源提供方而定

塔尖:

fastone云平台拥有自主可控的数据传输方案

你只需要把数据上传到的DM(Data Manager)工具上,就可以直接使用数据来跑任务。

与市面上开源的数据传输工具相比,DM使用方便、功能全面,利用fastone自主研发的分段上传、高并发、断点续传等数据传输技术,可大幅优化海量数据的传输效率。

IT视角:如何降低IT工作量?

4.1、需要IT掌握什么技能?

底层:

自己买机器需要强大的IT团队,搞定机房、硬件、环境、软件……等一系列事项。

超算中心与云厂商的情况比较类似,除了机器在别人机房你摸不着,IT需要协助研发搞定在使用过程中遇到的其他任何问题……

中层:

这一层,自家IT在熟读第三方平台操作说明之后可以帮上一定的忙。

塔尖:

借助多个自动化功能与管理系统(具体可见本章节其他回答),IT只需简单熟悉操作之后便可快速上手平台。

而R&D-IT服务的存在也让IT与研发之间的沟通更加顺畅。

4.2、机器多了之后,方便管理吗?

这个问题其实有两层含义,即机器多了之后——

1)是否可以方便地自动化运维?这里面涉及到包括开关机、软件安装配置、资源监控、集群管理等IT基础工作的自动化程度

2)是否可以方便地分配业务?比如临时需要将一批机器从团队A划拨给团队B使用,是否能够支持IT快速方便地进行配置

而能否做到第二点,事实上是由第一点决定的。也就是说,自动化运维的程度越高,越能够快速方便地分配业务。对IT来说,也就意味着更便于管理。

底层:

买机器需要IT自己搞定所有的运维工作,机器越多越麻烦。

超算中心提供统一的人工运维。

云厂商会提供诸如资源监控、集群管理模块等功能,具体使用程度取决于用户本身。

中层:

金字塔中层基本都具备一定的自动化运维能力,如资源监控、权限分配等,但同时也存在着一定程度的功能缺失,比如需要IT自行搞定支持列表之外的软件、除云厂商的仿真平台之外均缺失集群管理模块等等。

塔尖:

fastone云平台拥有完整的全维度自动化运维能力,机器再多都能轻松管理,快速分配业务。

比如大家都熟悉的集群管理,在云端手动管理集群和自动化部署的工作量区别一目了然:

4.3、权限管理方便吗?比如分配资源上限啥的?

底层:

均无此功能。

中层:

均可提供管理员账号和子用户权限分配功能。

塔尖:

支持管理员角色对每一个用户进行相关权限设定,包括预算使用上限和CPU核数使用上限。

4.4、需要用户自己来维护机器吗?

此处的“维护机器”专指对硬件的维护。

底层:

买机器需要自己负责所有机器的维护。

超算中心和云厂商无需维护。

中层:

无需自己维护。

塔尖:

无需自己维护。

4.5、有没有资源监控及相应的告警、优化分析功能?

底层:

买机器需要自己搞定资源监控。

超算中心的监控功能仅存在于全局统计,无法拆开,其他层面的监控功能缺失。

云厂商会提供类似Cloud Watch的基础监控功能,对云资源的监控十分细致,但配置相对复杂。

中层:

基本都支持资源监控功能。

云厂商的Cloud Watch在金字塔底层说过了,就不再重复了。

有的软件平台支持定制监控管理工具,可实时监控任务状态以及CPU/内存等资源的使用情况;也有的做了中央管理仪表板可视化功能,帮助你方便快捷地监控数据。

塔尖:

不同角色的用户可根据自身需求,查看所需的资源监控信息。如研发可查看单个任务的资源使用情况,IT则可通过监控功能掌握平台整体的资源消耗水平。团队管理者可以监控各个重要指标,从全局角度掌握项目的整体任务及资源情况,为未来项目规划、集群生命周期管理、成本优化提供支持。

4.6、有什么安全上的风险吗?

底层:

买机器的都是纯本地资源,需要自己搭建防火墙等安全措施,还得注意机房安全。而且机器在自己上手看似能完全掌控计算资源,其实麻烦更多,软件、硬件、机房、网络、人员……任何环节出了问题都可能影响你的仿真进程。

超算中心的底层是非隔离的,你能看到其他用户的任务信息,这是一个比较致命的问题。

更致命的一点是,而超算由于要优先服务国家级科研项目,在某些情况下,即便已经分配到的超算资源,也有可能会被无条件收回。

想象一下,有一天,你吃着火锅唱着歌,跑着仿真等结果,突然就被收回了资源……任务就凉了。

云厂商的是独占资源,可以理解为在海量云资源中划出一块专属区域供用户使用,别人无法触及。

独占资源意味着:

1)云资源在任何情况下都不用会被抢走;

2)可根据用户的习惯和应用的特性自由选择操作系统,没有任何限制;

3)应用与依赖组件安装灵活;

4)安全。

中层:

跟第三方平台底层资源保持一致。

塔尖:

fastone云平台提供的也是独占资源。

我们提供完整的云安全策略模型,可对整个安全生命周期进行管理。我们用更完善更具体的产品安全架构,全面保障客户业务系统安全,包括身份认证、操作日志、MFA、数据隔离、数据加密、数据审批、日志审计、安全规范、安全组织、风险预警等。

综合对比之后,我们来给8个产品/解决方案排个序:

关于fastone云平台在各种CAE应用上的表现,可以点击以下应用名称查看:

Bladed │ Fluent │ LS-DYNA │ COMSOL

END -

我们有个CAE仿真研发云平台

集成多种CAE/CFD应用,大量任务多节点并行

应对短时间爆发性需求,连网即用

跑任务快,原来几个月甚至几年,现在只需几小时

5分钟快速上手,拖拉点选可视化界面,无需代码

支持高级用户直接在云端创建集群

免费试用,送300元体验金,入股不亏~

更多电子书

欢迎关注小F(ID:imfastone)获取

你也许想了解具体的落地场景:

王者带飞LeDock!开箱即用&一键定位分子库+全流程自动化,3.5小时完成20万分子对接

这样跑COMSOL,是不是就可以发Nature了

Auto-Scale这支仙女棒如何大幅提升Virtuoso仿真效率?

1分钟告诉你用MOE模拟200000个分子要花多少钱

LS-DYNA求解效率深度测评 │ 六种规模,本地VS云端5种不同硬件配置

揭秘20000个VCS任务背后的“搬桌子”系列故事

155个GPU!多云场景下的Amber自由能计算

怎么把需要45天的突发性Fluent仿真计算缩短到4天之内?

国内最大规模OPC上云,5000核并行,效率提升53倍

提速2920倍!用AutoDock Vina对接2800万个分子

从4天到1.75小时,如何让Bladed仿真效率提升55倍?

从30天到17小时,如何让HSPICE仿真效率提升42倍?

关于为应用定义的云平台

八大类主流工业仿真平台【心累指数】终极评测(上)

2023仿真宇宙漫游指南——工业仿真从业者必读

当仿真外包成为过气网红后…

和28家业界大佬排排坐是一种怎样的体验?

这一届科研计算人赶DDL红宝书:学生篇

杨洋组织的“太空营救”中, 那2小时到底发生了什么?

一次搞懂速石科技三大产品:FCC、FCC-E、FCP

Ansys最新CAE调研报告找到阻碍仿真效率提升的“元凶”

国内超算发展近40年,终于遇到了一个像样的对手

帮助CXO解惑上云成本的迷思,看这篇就够了

花费4小时5500美元,速石科技跻身全球超算TOP500

速石科技(ID:Fastone_tech)

我们致力于构建为应用定义的云,让任何应用程序,始终以自动化、更优化和可扩展的方式,在任何基础架构上运行。希望和你共同建立持续迭代的多云世界观。

说出你的应用,我们就有故事~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/548381.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++/PTA 神坛

C/PTA 神坛 题目要求解题前提及思路凹包算法概念步骤 解题思路 代码tan(y/x)及tan2(y,x)函数 总结 题目要求 在古老的迈瑞城,巍然屹立着 n 块神石。长老们商议,选取 3 块神石围成一个神坛。因为神坛的能量强度与它的面积成反比,因此神坛的面…

记录:自回归 模型在记忆 全随机序列 的潜变量 统计量爆炸现象

只是一个记录 8层12头512维度的 GPT 模型,使用它来记忆 10000 条 512长度 的无序序列,vocab_size 为100。 模型要自回归生成这些序列,不可能依赖局部推理,必须依赖全局视野,即记住前面的序列。 然后统计 最后一个no…

HF宣布在transformers库中引入首个RNN模型:RWKV,一个结合了RNN与Transformer双重优点的模型

RWKV是一个结合了RNN与Transformer双重优点的模型架构。由香港大学物理系毕业的彭博首次提出。简单来说,RWKV是一个RNN架构的模型,但是可以像transformer一样高效训练。今天,HuggingFace官方宣布在transformers库中首次引入RNN这样的模型&…

QGC局域网内连接PX4模拟器JMAVSim

环境 QGroundControl 开源地面站系统; 代码地址: https://github.com/mavlink/qgroundcontrolPX4 开源飞控系统; 代码地址: https://github.com/PX4/PX4-Autopilot QGC可以直接下载运行包. PX4 请根据代码中的说明,进行环境的配置和运行. 通过代码去build地面站和PX4的步骤见官…

【Linux 之五】 Linux中使用fdisk命令实现磁盘分区

最近由于工作的需要,初步研究了uboot中的fastboot实现方式。研究fastboot不可避免的需要了解磁盘分区的相关知识点,在linux下可以使用fdisk命令实现磁盘的分区。好了,下面步入正题。 1. 查看帮助信息(fdisk --help) …

计算机网络 - 传输层

Transport-Layer Services Transport layer, 传输层主要是完成进程(proces)到进程(process)之间的通讯的. 在传输层之下的IP协议, 提供的是best-effort的传输, 也就是对信息的正确性没有保证, 也就是IP的协议是unreliable的, TCP的协议是在IP协议至少提供可靠的数据传输. UDP…

Word批量更改图片环绕方式与=尺寸大小

前提:一份Word文档里面有100张图片,有大有小,需要将100张图片更改为统一大小,宽度与高度均为5厘米,同时环绕方式也需要改成四周型。 默认Word图片的默认环绕方式为嵌入型,需要统一更改为四周型,…

多元时间序列 | RBF径向基神经网络多变量时间序列预测(Matlab完整程序)

多元时间序列 | RBF径向基神经网络多变量时间序列预测(Matlab完整程序) 目录 多元时间序列 | RBF径向基神经网络多变量时间序列预测(Matlab完整程序)预测结果评价指标基本介绍程序设计参考资料预测结果 评价指标 训练集数据的R2为:0.99805 测试集数据的R2为:0.98351 训练…

二叉树最大宽度_深度优先方式_20230520

二叉树最大宽度_深度优先方式_20230520 前言 给定一颗二叉树,求解其最大宽度。定义每层宽度为该层最左和最右之间的长度,也即左右两个端点之间的所跨越的长度,两个端点直接可能会包含一些延伸到本层的空节点,这些空节点的长度由…

【小沐学NLP】Python实现聊天机器人(OpenAI,模型概述笔记)

🍺NLP开发系列相关文章编写如下🍺:1🎈【小沐学NLP】Python实现词云图🎈2🎈【小沐学NLP】Python实现图片文字识别🎈3🎈【小沐学NLP】Python实现中文、英文分词🎈4&#x1…

Springcloud1----->Hystrix

目录 雪崩问题服务降级原理实践order降级处理user降级处理 服务熔断原理实践 hystrix,英文意思是豪猪,全是是刺,一种保护机制,即熔断器。 主页:https://github.com/Netflix/Hystrix/ 雪崩问题 在微服务中,…

selenium自动化测试报告_selenium自动化测试断言

一、元素操作方法 方法: 1、.send_keys() # 输入方法 2、.click() # 点击方法 3、.clear() # 清空方法 复制 注意:在输入方法之前一定要清空操作!! # 导包 from time import sleep from selenium import webdriver# 实例化浏览器 driver webdriver…

这才是自动化测试,资深测试构建持续交付体系(高质量)持续集成...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 软件测试-自动化测…

OptimizePI仿真流程

OptimizePI软件介绍 OptimizePI是用于针对PI设计进行优化的一个设计流程,可以针对PDN的设计进行仿真计算,主要功能包括以下几个: PDN前仿真分析PDN后仿真分析PDN阻抗检查去耦电容的回路电感分析芯片的电源管脚的电感分析去耦电容最佳位置评…

一文参透AB斗篷的前世今生

做FP独立站的应该都对cloak斗篷不陌生,cloak已经成为出海营销行业的必备工具之一。尽管使用cloak并不能保证一定有效,但不使用cloak却也是不可行的。今天本文将详细讲解cloak系统的“前世今生”,以便让大家更好地了解cloak系统并能挑选到最适…

【中间件】通过 docker-compose 快速部署 Zookeeper 保姆级教程

文章目录 一、概述二、前期准备1)部署 docker2)部署 docker-compose 三、创建网络四、Zookeeper 编排部署1)下载 Zookeeper2)配置3)启动脚本 bootstrap.sh4)构建镜像 Dockerfile5)编排 docker-c…

如何使用ChatGpt来学习和提问【对话ChatGPT】?

ChatGPT的不断发展和进步,我们需要工作中很多时候会用到ChatGPT,那么如何使用ChatGPT来解决我们工作中的问题呢? Q1如何向ChatGPT提问,从而更快解决我们的问题? ChatGPT:以下是向ChatGPT提问的一些提示&a…

CISSP和Security+的区别和学习建议

当谈到网络安全认证时,经常有朋友问我CISSP 与 Security认证。两者都是业内比较认可,对实际工作有所帮助的认证,但是哪一个适合自己呢,区别又是什么呢? 在深入研究细节之前,让我们先简要了解一下 CISSP 与 …

深度学习之自编码器实现——实现图像去噪

大家好,我是带我去滑雪! 自编码器是一种无监督学习的神经网络,是一种数据压缩算法,主要用于数据降维和特征提取。它的基本思想是将输入数据经过一个编码器映射到隐藏层,再通过一个解码器映射到输出层,使得输…