云从科技大模型之路:昇思“黑土地”上的生态炼成记

news2024/11/18 13:31:57

文 | 智能相对论

作者 | 李永华

一线客户经理,为客户一键生成周全的资产配置建议;

中端管理人员,获得系统自动撰写的一整套数据分析报表,快速、准确授信;

金融市场的“操盘手”,能够实时获取那些影响市场走势的舆情分析;

……

这些,是金融大模型落地后,预期将给行业带来的巨大改变——工作效率大大提升、工作成果质量得到切实保障。

这样的大模型,目前市面上已经有很多厂商在积极开发。

人工智能科技企业云从科技就是其中之一。

一个月前,云从科技正式发布大模型 “从容”,“从容”将以更好的交互性能,应用于金融、政务、交通、能源、教育、医疗、文娱等行业领域,其中金融等赛道将是重点布局的方向。

大模型浪潮下,像云从科技这样在AI领域有深厚积累的厂商,正在实现大模型的快速内测、公测、面向产业垂直场景落地。

而云从科技能够快速布局、出成果,除了自身在AI技术方面的积淀,还依托于全场景AI框架昇思MindSpore的开放生态。

以开放的姿态帮助有志于大模型的开发者、厂商实现大模型创新,昇思的玩法与云从科技的成功,让当下全球大模型创新之路更明晰——“黑土地”模式正在加速促进大模型的繁荣。

AI框架价值凸显,大模型走入“黑土地”生态繁育模式

在大模型的开发过程中,AI框架在基础硬件层面对接多样化的算力,在模型、应用层面做到能力支撑(本身也被行业定义为AI“操作系统”)。在当前,业界急切地关心一个个大模型的能力与效果如何,在技术方面最多看看参数量、计算成本等,而暂时没有将目光放到大模型开发过程中的各种基础软件技术支撑上,导致AI框架价值没有出现在普遍的业界视野当中。

就在最近,人工智能框架生态峰会2023在上海举办,500家伙伴、行业客户、高校、研究机构等代表参会,围绕AI框架如何与大模型有效融合推动大模型场景应用,进行了系列交流和探讨。

在峰会上,18家AI头部企业、高校、科研机构、开源社区等共同发布了“共建人工智能框架生态,繁荣中国人工智能产业”联合倡议,要共同努力推动AI框架生态发展、推动大模型发展。

作为中国AI框架的典型代表,昇思将以开放的姿态,支撑更多伙伴更好地开发与落地大模型。

以此为标志,可以认为大模型的“黑土地”时代正式来临。

何谓“黑土地”模式?

在其下,是坚实的地基——多样化的算力来源都可以兼容;

在其上,是可以自由生长的物种丛林,高矮胖瘦适合各种“审美”(场景需求)的物种都可以扎根、成长。

与此对应,“黑土地”之上,AI框架的优质伙伴厂商就成为重要的耕耘者,最终耕耘出一片大模型繁茂的生态。

而开篇提到的云从科技,就是昇思这片黑土地上的重要耕耘者之一。

将昇思能力引入其人机协同操作系统(CWOS)之上,云从科技正面向政府、企业以及消费者三个大致方向进行相关大模型的产品落地。

这背后,是云从科技自身禀赋与昇思能力的有效结合。

因为,要最终催生优质大模型成果,黑土地的品质、耕耘者的能力,都必不可少。

让昇思这片“黑土地”物尽其用,云从科技已齐集“耕耘者”必备的三大硬实力

“黑土地”模式下,耕耘者必须具备三大条件,才能培育出有价值的大模型成果。这些,正是云从科技的禀赋所在。

1、不是“平地起高楼”,而是已经具备AI创新的“基因”

大模型仍然是AI领域的延伸,这一大步要走的扎实,必须在AI领域已经跋涉多时。

那些出彩的大模型,包括国外的ChatGPT,国内的紫东.太初等,都基于过去长年的AI开发经验。

而云从科技,就是这样一个有深厚积淀的厂商。

2015年,云从科技从中科院孵化出来,拥有全链AI能力,已经在各种权威奖项中9次斩获人工智能世界冠军,且承建AI相关的三大国家平台,参与众多国家与行业标准制定。

2022年5月,云从科技完成科创板上市,成为科创板首家AI平台公司。

在国内,云从科技是较早的将预训练模型应用到具体项目中的企业,在大模型走向场景应用所需要的“下游任务精调”方面,有充分的技术储备和实践经验。

除了能力,在资源方面,云从科技还储备了数千张卡规模的算力资源,可同步满足3组基础大模型和10组行业大模型的训练和调优工作,未来还计划扩展到上万张卡——具备深厚的AI技术能力的云从科技,自己还打好了“地基”。

2、不是完全依赖外部经验输入,而是塑造了支撑大模型的“枝干”

在AI能力沉淀的基础上,云从科技还创新了一套适合自身能力特点的大模型“耕耘”方式。

云从科技对昇思的引入,建立在自家人机协同操作系统(CWOS)之上。

CWOS是一套从信息化到数字化再到智能化渐次递进的数字化架构,致力于让机器像人一样思考和工作,大致可以概况为三个层面:信息化阶段通过AIoT等获取各类数据,数字化阶段处理数据、转化知识,智能化阶段实现场景的各种应用,这其中包含有感知、认知、决策各领域的核心技术。

这使得CWOS与大模型天然亲和,后者可以作为智能化阶段的重要构成要素(未来可能是支柱型技术)。

早在今年1月,云从科技就对外宣布已经陆续在NLP、OCR、机器视觉、语音等多个领域开展预训练大模型的实践,其背景,就是CWOS可以无缝整合众多技术平台,快速入局大模型赛道。

自然,CWOS也能无缝接入昇思。

目前,云从科技与昇思联创了一套基于CWOS的方案:

这个由端(信息化,获取数据)、边(处理数据、转化知识)、云(智能化支撑场景应用)三重架构组成的联创自主方案,完整体现了CWOS一直以来的思维方式,将云从科技的能力与体系,与昇思进行了完整融合。

如此,CWOS便可以支撑更多行业平台和应用的通用化、智能化大脑,利用大模型能力发挥视觉、语音、NLP技术的优势。

3、不是盲目落地,而是有场景实践经验来保证“果实”生长

在落地阶段,大模型去赋能千行百业,往往需要在对应的行业、场景已经有相关的合作与实践。

首先,是直接的合作伙伴。

直白地说,要有行业代表性企业一起来推进,要有末端、有抓手、有路径。

云从科技历经长期与各垂直领域企业的紧密合作,在数字政府、金融、大交通、智能制造等领域,可以直接联合各行头部企业、机构打造不同的行业大模型,推动行业数智化建设。

然后,是数据与认知上的积累。

深入垂直行业的大模型,“大”可能不是关键,“专”才更重要,专有数据的运用,要赛过追求“绝对数据”。

云从科技采用的“专家知识”+“人工智能”大模型路线,在行业数据、专家知识等方面的深度储备,为行业大模型奠定了基础。

最后,是直接的应用探索。

云从科技的大模型,在智慧政务方面为市民提供出游建议,在传媒行业帮助提升数字人直播质量,在教育行业减轻教师任务工作量……这些都与其长期在这些行业的AI应用创新探索有直接的关系——只不过是更进一步将大模型能力融合其中。

开篇提到的金融行业大模型,同样是云从科技重点深耕的领域,为此,云从科技还专门进行了长期规划,要在2025年完成金融、智能制造、机场交通等领域通过大模型带来认知能力的跃迁,让人机协同能力更进一步。

“黑土地”够肥沃,大模型生态才能持续繁盛

从云从科技的案例中,可以发现厂商自身禀赋的重要性,但昇思与CWOS的协同同样是关键所在。

只有“黑土地”足够肥沃,才能支撑起一片繁茂的生态。

好在,敢于以开放、多元、包容姿态出现昇思,已经有充分的准备。

首先,在技术方面,昇思已经完成对大模型多方面的能力支撑。

在2020年的首版本中,昇思就在行业中率先推出了面向大模型自动并行特征。在持续的发展过程中,昇思一直致力于将大模型孵化过程中的系统工程难题集成到软件框架中解决。较为典型的,如昇思社区已经开源了15+个基础训练模型以及训练脚本(包括常用的BLOOM、LLAMA等)。

在最新的昇思2.0版本中,大模型全流程解决方案正式推出,拥有面向大模型的众多特性:脚本开发阶段实现极简易用,训练阶段实现硬件资源的高效利用,场景微调阶段实现低参微调算法的整合,部署阶段实现算力成本的节约,等等。

然后,在实践方面,已有“大树”级大模型被昇思这片黑土地所孕育。

实际上,在大模型火热的浪潮开启之前,昇思就已经支撑了很多知名行业大模型的发展,“黑土地”模式并不是现在才开始。

当前,基于昇思孵化的大模型数量已经超过20个。

例如,中科院研发的全模态大模型“紫东.太初2.0”,就拥有语音、图像、文本、视频、传感信号、3D点云等复杂模态识别能力。

已经啃下“硬骨头”的昇思,在帮助云从科技等企业时,就变得更底气。

最后,在软硬件协同方面,昇思还实现了大范围的兼容或适配。

目前,昇思面向端边云全场景开放,已适配了国内主流的AI芯片和硬件设备超过20款。

这使得“黑土地”可以敷设在大部分“地基”之上。

云从科技与昇思联创的大模型云平台(MaaS,用于赋能更多行业客户创造属于自己的大模型),其底层就利用到了Altas系列计算资源。

现在,474万的开源社区下载量,1.3万的社区贡献者,5500家服务企业数量,400多个开源模型,超900篇顶会论文,昇思自身的技术能力在积极的生态建设下,还在不断进化。

这片“黑土地”还在不断肥沃,更多类似云从科技这样的大模型耕耘者还将持续加入,共同繁育大模型生态。

*本文图片均来源于网络

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/687254.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

系统性能测试流程总结

一、测试前期准备 1、确定用户、业务、系统需求(目标) 1)确定客户的需求和期望 在需求分析和文档的支持下,需要对软件系统上的用户业务使用情况进行分析,提出我们所关注的性能测试需求,并告知业务人员。…

2023-6-26-第八式装饰器模式

🍿*★,*:.☆( ̄▽ ̄)/$:*.★* 🍿 💥💥💥欢迎来到🤞汤姆🤞的csdn博文💥💥💥 💟💟喜欢的朋友可以关注一下&#xf…

【FFmpeg实战】视频解码流程

原文链接:https://blog.csdn.net/weekend_y45/article/details/125168344 一、解码流程使用到的FFmpeg结构体说明 1、AVFormatContext结构体 该结构体描述了一个媒体文件或媒体流的构成和基本信息。它是一个贯穿始终的数据结构,很多函数调用需要使用到…

【云原生丶Docker】理解Docker的核心概念

Docker的核心优势是什么? 在 什么是虚拟化技术? 一文中,我们对虚拟机和 Docker 都有了简单的了解,需要的小伙伴可以自行跳转回顾~ Docker与传统虚拟化技术有什么区别? Docker 相比传统的虚拟机技术更轻量级&#xff0…

TikTok上的中国商品,老外买上瘾了!

在TikTok的全球影响力下,一些中国商品正实现销量的创纪录增长 2022年底,TikTok发了其第五份“Year on TikTok”年度报告,概述了过去12个月TikTok平台上热度最高的创作者、视频内容,以及#TikTokMadeMeBuyIt标签下最热门的5大产品&…

c语言printf输出格式(%d %f %e %x)

一、%d第一组:%d %nd %-nd第二组:%d %0nd %-0nd %.nd第三组:%d %m.nd %-m.nd 二、%f%f %.nf %m.nf %-m.nf 三、%e%e %.ne %me %-me %m.ne %-m.ed 四、%x%x %0nx %nx %-nx 一、%d 第一组:%d %nd %-nd ①n表示输出宽度&#xff08…

深度学习中使用的16位浮点数格式

深度学习中使用的16位浮点数格式 flyfish 文章目录 深度学习中使用的16位浮点数格式浮点数是一个近似值浮点数的表示float单精度类型 和 double双精度类型 的比较查看所占的字节数大小端的比较计算方法16位 float 半精度格式bflat16格式bflat16格式 与 float32单精度格式 比较…

手敲MyBatis(十二章)-ResultMap解析映射使用

1.前言 这一章节主要解决好几章之前留下的坑,需要根据XML配置的ReultMap进行解析映射成具体的PO供用户使用。 我们本章就来解决下在xml中配置了如下标红框的内容,怎么解析映射到具体的实体类中,如下就是将id为activityMap的resultMap怎么解…

发送图文并茂的html格式的邮件

本文介绍如何生成和发送包含图表和表格的邮件,涉及echarts图表转换为图片、图片内嵌到html邮件内容中、html邮件内容生成、邮件发送方法等 一、图表处理 因为html格式的邮件不支持echarts,也不支持js执行,所以图表需要转换为图片内嵌在邮件内容中 因为平…

Sui Builder House京都站倒计时!

Sui Builder House京都站将于6月29日-30日举行,为世界各地的开发者提供身临其境地学习和交流的机会。查看Sui Builder House京都站的五个亮点 活动信息 📆 Builder House时间:2023年6月29日 — 6月30日 📍 活动地址:…

NetSuite OAuth1.0中InvalidSignature问题

本周闭关写代码,用Java通过TBA方式访问NetSuite REST Webservices。由于是手生,卡在InvalidSignature报错上,在这个问题上被卡了一整天。 直到终于到来的Aha时刻。 在NetSuite中的样例代码是PHP的, 我平移到Java后,代码…

【云原生丶Docker】虚拟化技术简介

什么是虚拟化技术? Docker 是一款基于容器虚拟化技术构建的软件,那到底什么虚拟化技术呢?在学习 Docker 之前,先简单了解下虚拟化技术。 虚拟化是云原生的实现基础,它能够帮助我们更加有效地利用物理计算机硬件。 虚…

clip-interrogator本地部署

clip-interrogator本地部署 1. 克隆源码2. 创建虚拟环境及配置3. 下载远程相关文件3.1 下载Salesforce相关文件失败3.2 下载cache相关文件失败3.3 解决库不完整问题 4. 测试代码4.1 脚本一4.2 脚本二4.3 测试run_cli.py文件4.4 测试run_gradio.py文件 源码链接:http…

d3dcompiler_47.dll缺失怎么办?d3dcompiler_47.dll缺失修复方法(详解)

d3dcompiler_47.dll在Windows操作系统和 DirectX应用程序中使用此 DLL 文件,包括游戏,图形处理软件,CAD软件和其他3D应用程序中。如果电脑提示“由于找不到d3dcompiler_47.dll,无法继续执行此代码”,“d3dcompiler_47.dll缺失”&a…

Docker卷与持久化数据

数据主要分为两类,持久化的与非持久化的。 两者都很重要,并且Docker均有对应的支持方式。每个Docker容器都有自己的非持久化存储。非持久化存储自动创建,从属于容器,生命周期与容器相同。这意味着删除容器也会删除全部非持久化数…

网络维护岗位个人求职简历

网络维护岗位个人求职简历1 姓名: 国籍:中国 目前所在地:广州民族:汉族 户口所在地:湖南身材:170cm64kg 婚姻状况:未婚年龄:28 求职意向及工作经历 应聘职位: 工作年限&a…

day14_面向对象的三大特征之一(继承)

继承的概述 Java是对现实社会的模拟,现实中有儿子可以继承父亲的财产,因此有了富二代的。 java中多个类中存在相同属性和行为时,将这些内容抽取到单独一个类中,那么多个类中无需再定义这些属性和行为,只需要和抽取出来…

【Java-SpringBoot+Vue+MySql】项目开发杂记

目录 1、关闭eslint 2、 新建路由 3、安装jQuery依赖-在Vue使用JQuery语法 4、MySQL———数据全部清除,自增归零 5、前后端数据传递——增加功能 6、使用element-ui获取当前表格中的数据——删除功能 1、关闭eslint 2、 新建路由 {path: /user,component: Lay…

LLM - Hugging Face 工程 BERT base model (uncased) 配置

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://blog.csdn.net/caroline_wendy/article/details/131400428 BERT是一个在大量英文数据上以自监督的方式预训练的变换器模型。这意味着它只是在原始文本上进行预训练,没有人以…

RabbitMQ实现延迟消息,RabbitMQ使用死信队列实现延迟消息,RabbitMQ延时队列插件

文章目录 一、什么是延迟消息1、队列的属性2、消息的属性3、什么是死信4、使用死信队列的缺点5、延时消息插件 二、JavaAPI利用死信队列实现RabbitMQ延迟消息1、代码实现2、基本流程 三、JavaAPI利用插件实现RabbitMQ延迟消息1、代码实现2、基本原理 四、Springboot利用死信队列…