大模型时代,「重识」云知声

news2024/11/24 4:56:36

在山海大模型发布会现场,黄伟有一句话令人印象深刻,“云知声的过去十年,就是为山海而生。 

作者| 皮爷 

出品|产业家 

“谁能做成中国最好的大模型?”在今年3月一个北京投资人的内部分享会上,有人满怀期待地提出这样一个问题。但可惜,这个问题没有答案,或者说没人可以论证自己的答案。

在过去的几个月时间里,伴随着ChatGPT这款现象级产品的出现,大模型的热度只增不减,不论是互联网大厂,还是新兴的互联网创业者,抑或是传统AI企业,推出的大模型如雨后春笋般出现在市场。

根据不完全统计,今年3月以来,中国市场已经出现超过30款大模型产品,其覆盖领域除了固有的通用大模型,更有专门面向细分赛道的中模型(产业模型),如低代码、工业、能源等等。

但两个月过去了,文章开篇的问题依旧没有答案。

几个最现实的问题是,伴随着大模型数量的增加,市场对大模型产品本身抱有更现实,或者说更审慎的态度,即大模型究竟能解决什么问题?在智能对话、逻辑推理之外,大模型距离能落地到真实的产业场景,还有多远的路要走?它需要多久才能转化为真正的社会生产力?

问题背后,对应的不仅是市场对大模型产品的深度思考,也更是对当下中国数字化、智能化未来的方向探索。大模型产品背后的企业需要用更落地的动作,完成自证。

最近,产业家连线了云知声创始人兼CTO梁家恩博士,从他的视角来理解这次大模型浪潮到底意味着什么,以及对云知声,这家AI赛道的老兵而言,它正在交出的是一张怎样的答卷。

在他和云知声看来,变化和自证,已然在路上。

云知声,「交卷」 

511分——这是在云知声大模型发布现场,云知声创始人黄伟公示的一个分数。它是云知声山海大模型能在临床执业医师医学考试中拿到的分数,这个考试总分是600分,而参加考试的考生平均分是365分。

在医疗领域,MedQA评测也超过81分,这是一张超过GPT-4的成绩单。

“我们想经过领域增强训练,让大模型在专业领域从本科训练到博士。”梁家恩告诉产业家。而在医疗领域,这个想法正在落地。

这也正是这次云知声山海大模型发布会的不同之处。即在市面上大模型现场展示的语言对话能力、逻辑推理能力之外,山海大模型传出的声音也更多在集中产业层面,比如医疗、家居、教育、汽车等多个产业领域。

以医疗领域为例,人们不仅可以基于某个病症获得准确的医疗答案,在临床中,医生更可以通过语音生成病历关键词,在山海大模型的辅助下,基于病历辅助医生生成完整的病历方案;同时也更可以帮助患者和保险公司进行医疗相关的保险理赔。

再比如在物联网领域,山海大模型可以实现主动智能、情感化回复以及多轮复杂对话等等,像钢铁侠里的“贾维斯”一样帮助人们安排日程,成为智能物业管家。

此外,山海大模型还可以成为特定领域的“销售专家”“知识管理专家”“口语专家”等等,基于大模型对特定的产业场景进行深度赋能。

“现在基本上OpenAI等机构列出的开源英文语料类别和中文语料类别,我们都已经进行了训练,还增加了自己的中文和医疗数据。”梁家恩告诉我们。

根据云知声的“U+X”战略,山海大模型交出的这张答卷不仅在通用大模型的“肌肉”上,如常规的语言生成、语言理解、逻辑推理、数据和代码能力、安全合规能力,也更在具体的产业落地上,即通过插件扩展、领域增强和企业定制,在专业的产业领域实现更针对性的落地和适配。

这是一张怎样的答卷?

从专用到通用,路径背后的AI TO B 

“比如如果OpenAI通用能做到95分,但很多专业领域可靠性还达不到实用化要求;我们的通用基座可以做到90分,然后会优先在不同领域分别进行强化,最终能在领域里落地。”梁家恩表示。

伴随着OpenAI的持续大火,在人们惊叹AI迎来转折点的同时,一些隐性的问题也更在出现,比如对GPT模型而言,其目前更展现的价值点在通用板块,如对语义的理解,逻辑推理等等能力,但在具体的产业侧,它必须要进行针对性的训练才能满足基本要求。

其中,医疗是当下人们谈论最多的领域,作为一个“严肃”的学科和领域,其医疗对大模型在训练过程中出现的“幻觉”现象可谓是零容忍,换言之,如果大模型想要在医疗领域落地,就必须进行足够专业的数据训练和微调,才能实现“产业化”。

也可以说,如果说金融行业是数据库等国产厂商能力自证的高地,那么医疗作为复杂度和知识密度极高的行业,恰可以看作是大模型具备产业赋能能力的最强磨刀石。

“在此之前,我们做了大量的医疗智能化案例,有大量的医疗数据积累,以及全面的知识图谱能力,这是我们预先选择医疗方向的基础。”梁家恩告诉我们。

这是云知声一直选择出击的方向。以云知声的「医疗语音录入系统」为例,其可以让医生通过说话实时把文本录入到希望输入的地方,解决固有的“一边交流,一边记录病历”的问题,释放医生在病历誊写上的时间。

据了解,这套系统的语音识别准确率达到 95% 以上,尤其在神经科、免疫内科、血液科、普通内科等疑难杂症患者多的科室应用效果好,个别科室的语音识别率甚至超过 98%。

类似的医疗智能化案例在过去几年是云知声发力的主要方向之一,而这些智能化的解决方案和数据如今都被训练到山海大模型中。据了解,接下来,山海大模型将在国内头部三甲医院陆续落地。

和医疗类似,物联网也是云知声山海大模型重点落地的一个方向。基于大模型的能力,云知声可以在原有的AIOT生态基础上做到智慧物联3.0。同样的,这项能力如今也已经在部分智慧产业园区等场景中逐渐落地。

医疗、物联网对应的方向也恰是云知声在走的大模型路径——由专用走向通用。即相较于在通用大模型的底座上不断进行通用数据叠加,云知声的做法是在底层通用底座的基础上,直接到专用(产业)领域进行针对化的训练,“逐步把每个领域都做到博士水平”,最终反哺底座大模型实现更为准确的产业表达。

实际上,这恰是最符合当下产业落地的大模型路径。即真正从产业的问题和实际情况出发,进行相应的产业模型表达,通过一个个专业领域的模型能力沉淀,最终做到底座大模型的“通用化”和“专业可靠”。

此外,伴随着产业数据的不断涌入,云知声通过优化后的框架和梳理过的高质量数据,保证大模型具备“抗臃肿”属性的同时,实现模型的准确度和产业服务能力。

“数据并非越多越好,包括学术界大家也在讨论,在达到一定的数据量后,模型的准确度和效果就不会随着数据量的增加而不断优化,数据质量和多样性更关键。”梁家恩告诉我们,“最终还是要回归到框架和数据的优化。”

如果把时间线往前翻,早在2016年,云知声团队就开始建立大规模超算平台Atlas,在这个希腊神话里代表泰坦族擎天神的平台之上,云知声开始了如前文所说的医疗、物联网等产业方向的AI赋能尝试。

“所以,现在单纯堆数据对云知声来说是没有任何难度的,难度在于在一个个具体的产业里能实现落地,可靠并且可用。”梁家恩表示。

大模型时代,被释放的「AI力」 

如果从更大视角来看云知声选择的路径,会发现一切并非偶然,注重工程优化和产业规模化能力是其突出特点,也更不是一条容易的路。

比如,2016年底层Atlas平台建立时,云知声还仅是一个成立4年的创业公司,“硅谷的专家甚至惊讶,一家成立四年的创业公司考虑这个问题还太早。”

比如,在Atlas平台之上的数据中心模型优化(DCML)层。在2016年云知声开始进入医疗行业后,逐步意识到解决不同医院和科室的数据差异性,是实现规模化应用的关键,就开始构建“统一模型架构+数据迭代调优”的开发模式,即将AI能力能够更为标准化地应用到各个领域,进而实现AI能力的泛“标准化”,就是现在支撑山海大模型训练的DCML平台。

再比如,同样是在2016年,云知声将行业内普遍认为的“靠GPU才能跑起来”的深度学习技术,优化到能在CPU甚至手机芯片上跑起来。同时期,他们甚至把模型做进了主频只有200MHz、计算内存只有200k的WiFi芯片中。

这些在当时看来“不合常理”“超前、费力”的布局,如今都在构成着云知声在这场新的大模型潮水中交出自己答卷的底气。不论是医疗,还是家居,再或者是如今云知声正在深入“教育”等行业,山海大模型都能基于完整的技术支撑实现快速的适配和落地。

梁家恩告诉我们,现在山海大模型在本地部署,企业只需要使用“A10”级别的GPU,就可以达到使用“A100/A800”的推理效果,前者成本仅1万人民币左右,而后两者成本均超过上万美元,本地部署成本降低甚至可以超过80%,后续还可以进一步优化。

在技术支撑之外,基于过往在医疗等行业服务的经验,云知声可以更为迅速地在其它领域进行知识图谱的搭建,配合大模型做到更专业的落地。这是所有AI企业都在实践的路径,当同时兼具大模型和知识图谱能力的团队并不多。

用梁家恩的话来说就是,“如今云知声正在进行第三次技术升级。”如果说2016年,云知声完成的是从“声(感知)”到“知(认知)”的全栈技术体系升级,那么在2022年开始,这家AI企业正在完成的是从“专用AI走向通用AGI”的升级。

不过,今天又和2016年云知声面临的情况不同。

即尽管2016年云知声不论是从底层超算平台,还是上层的数据模型,再或者是基于医疗行业的深入,都在进行创新式的尝试,并验证了企业自身前进的路径。但在当时的时间点,不论是AI能实现的功能和不同行业的复用性,还是人们对AI的认知,都停留在浅层面。

可以理解为,之前AI的生产价值更多的是“专用业务系统+标准AI零部件”的组装模式,业务层的标准化和复用性相当不足,理解能力和灵活性上都有瓶颈;但现在伴随着大模型的出现,可以通过自然语言对接大部分任务,智商显著提升,且能通过大模型调优而非编程方式拓展业务能力,MaaS模式开始成为可能,它正在重新定义AI在企业数字化转型中的位置和作用,更为具体化,也更为有实操性。对AI企业而言,其也对应的是更强大且能够复用的产品技术价值。

换言之,大模型打破了市场对如云知声这样的AI企业设定的业务边界和商业价值的认知壁,重新认识到整合语言、知识、推理、决策等认知能力的大模型,对业务智能化的核心价值和重要意义,它们能做的事情、未来能达到的想象空间,都在有了更新的界定。

而这些的基础,也恰都建立在云知声这样的企业在过往多年的技术坚持和市场探索。在这个AI正在成为社会核心生产力的当下,云知声们正在成为真正的主角。

在山海大模型发布会现场,黄伟有一句话,令人印象深刻,“云知声的过去十年,就是为山海而生。”

写在最后:

云知声的大模型路径可以总结为“产业AI”。即市面上不少大模型的路径是,先进行大模型的底层训练,训练到一定数量级再去寻找能够落地的产业场景和价值。

但云知声的目的和方向都很明确,即初始方向就是在通用大模型的基础上,实现某个专用(产业)的模型能力增强和落地,并且先在医疗和物联等优势产业验证,再拓展不同应用场景分别进行训练尝试,衡量标准是模型是否能在产业内可用、可靠、有价值。

从大模型没有达到终局的现阶段来看,虽然不能论路径的对错与否,但云知声等企业的路径更能让大模型与真实世界产生交集和连接,并且由此一步步转化为真实可见的生产力,不单纯完成TO C的呈现,更实现了在产业侧的“非泡沫”论证,在具体的医疗产业侧,目前其效果和能力更是在超过GPT-4。

这是云知声带来我们的思考,也更是中国AI技术的一次新的自证。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/565218.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java SPI 一 之SPI(Service Provider Interface)进阶 AutoService

​ 一、SPI(Service Provider Interface) 1.1 介绍 SPI(Service Provider Interface),是JDK内置的一种 服务提供发现机制(为某个接口寻找服务实现的机制),可以用来启用框架扩展和替换组件,其…

Admin.NET管理系统(c#+vue3)前后端学习笔记

我的学习笔记 - 9iAdmin.NET 欢迎学习交流(一)前端笔记1.1 关于.env的设置1.2 关于路由模式问题1.3 关于 vue.config.ts1.4 关于 打包(pnpm run build)溢出问题1.5 关于 打包(pnpm run build)后部署到IIS重…

article-六轴码垛机器人admas正逆运动学仿真

基座自由度、大臂摆动自由度、小臂摆动自由度、腕部Y轴摆动自由度、腕部Z轴摆动自由度及其腕部末端X轴旋转自由度 其导入过程为: 机器人三维模型总体有6个部分。打开机器人的SolidWork三维模型,依次另存为6个“Parasolid(x_t)”类型的文件。打开ADAMS/…

【MATLAB第36期】基于MATLAB的QOWOA-LSTM鲸鱼优化算法准反向策略的WOA优化LSTM时间序列预测模型 优势明显,注释详细,绘图丰富

【MATLAB第36期】基于MATLAB的QOWOA-LSTM鲸鱼优化算法准反向策略的QOWOA优化LSTM时间序列预测模型,优势明显,注释详细,绘图丰富 一、代码优势 1.使用优化后的QOWOA算法优化LSTM超参数(学习率,隐藏层节点,…

2020下半年上午题

2020下半年 d a b 小阶向大阶对齐 b b 平均cpi: MIPS: d c 公加验,私解签 加密防止被动攻击,认证防止主动攻击 a 访问控制包括:授权,确定存取权限,实施存取权限 c a c a 先申请先得 b b 著作权包括&…

OpenCV使用SURF和SIFT算法报错解决记录

OpenCV使用SURF和SIFT算法报错解决记录 1.报错代码,使用以下两种写法都会报错 # 创建SIFT和SURF特征提取器 # 写法1 sift cv2.xfeatures2d.SIFT_create() surf cv2.xfeatures2d.SURF_create() # 写法2 sift cv2.SIFT_create() surf cv2.SURF_create()第一种报…

架构整洁之道下篇(实现细节)

目录 1.实现细节 1.1.数据库只是实现细节 1.2.Web是实现细节 1.3.应用程序框架是实现细节 1.4.案例分析:视频销售网站 1.5.拾遗 1.5.1.按层封装 1.5.2.按功能封装 1.5.3.端口和适配器 1.5.4.按组件封装 1.5.5.组织形式和封装的区别 2.总结 1.实现细节 …

13_Uboot移植

目录 查找NXP官方的开发板默认配置文件 编译NXP官方开发板对应的uboot 烧写验证与驱动测试 SD卡和EMMC驱动检查 LCD驱动检查 网络驱动 在U-Boot中添加自己的开发板 添加开发板默认配置文件 添加开发板对应的头文件 添加开发板对应的板级文件夹 修改mx6ull_alientek_…

Vue——状态管理库Pinia

写在前面:本文参考小满大牛的pinia专栏 一、Vuex与Pinia Vuex 和 Pinia 均是 Vue.js 的状态管理库,它们为 Vue 应用程序提供了一种集中式的、可预测的状态管理解决方案。 Vuex 是 Vue.js 官方推荐的状态管理库之一。它的核心概念包括 state、mutation…

【C++初阶】类与对象(中)之取地址及const取地址操作符重载

👦个人主页:Weraphael ✍🏻作者简介:目前学习C和算法 ✈️专栏:C航路 🐋 希望大家多多支持,咱一起进步!😁 如果文章对你有帮助的话 欢迎 评论💬 点赞&#x1…

架构整洁之道中篇(组件构建原则软件架构)

目录 1.组件构建原则 1.1.组件 1.2.组件聚合 1.3.组件耦合 2.软件架构 2.1.什么是软件架构? 2.2.独立性 2.3.划分边界 2.4.策略与层次 2.5.业务逻辑 2.6.尖叫的软件架构 2.7.整洁架构 2.8.层次与边界 2.9.Main组件 2.10.测试边界 2.11.整洁的嵌入式…

Edgedetect2

边缘检测,检查数据变化,用异或实现 对于 8 位矢量中的每个位,检测输入信号何时从一个时钟周期变为下一个时钟周期(检测任何边沿)。输出位应在发生 0 到 1 转换后设置周期。 以下是一些示例。为清楚起见,in…

HNU-电路与电子学-小班4

第四次小班讨论 一、题目 1、书 3-41、3-62 2、书 4-23、4-26 3、设计一个时序电路。该电路仅在连续三个或三个以上时钟期间,且两个输入信号 X1 和 X2 相同时,输出信号 Z 为 1,其余情况 Z 为 0。试做出该电路的 Mealy 机和 Moore 机状态…

Windows:设置右键用RStudio打开文件和文件夹

0. 前言 在使用RStudio写R脚本的时候总是要先打开它,再通过它打开脚本和文件夹,感觉不是很方便。由于VSCode以及其他软件都可以整合到右键菜单中打开文件或文件夹,因此就折腾了一下怎么在右键中使用RStudio打开文件,下面是效果展…

简析java JNI技术

前言 认识JNI(Java Native Interface)技术,了解Java调用本地C/C库的简单原理以及一些基本的知识点;自己编写一个自定义的JNI接口。 一、简介 JNI是Java Native Interface的缩写,通过使用 Java本地接口书写程序,可以确保代…

在vue3中如何使用百度地图API(详细步骤+demo示例)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、注册账号、申请成为开发者二、申请密钥AK三、在vue3.0中使用百度地图API 提示:以下是本篇文章正文内容,下面案例可供参考 一、注册账号…

htb Mailroom里容器(Debian 11)图形界面显示在本机kali上,socat,unix转发,容器里不安装xrdp

在攻击机kali(ip:10.10.14.18)上运行chisel服务端: chisel server -v -p 60080 --socks5 在靶机的虚拟机(ssh root10.10.11.209)上,执行docker exec containers_sites_1 /bin/bash,进入容器里 进入容器后,先下载kali上的socat和chisel: curl -o /bin/chisel http://10.10.14…

使用JMeter+Grafana+Influxdb搭建可视化性能测试监控平台

【背景说明】 使用jmeter进行性能测试时,工具自带的查看结果方式往往不够直观和明了,所以我们需要搭建一个可视化监控平台来完成结果监控,这里我们采用三种JMeterGrafanaInfluxdb的方法来完成平台搭建 【实现原理】 通过influxdb数据库存储…

初学用于华为鸿蒙系统(HarmonyOS)的编程开发工具HUAWEI DevEco Studio:你好,鴻蒙~

本文是6月6日博文“初学用于华为鸿蒙系统(HarmonyOS)的编程开发工具HUAWEI DevEco Studio”的续篇。 成功通过华为开发者联盟的实名认证审核后,使用远程模拟器(Remote Emulator)运行程序。 步骤如下: 菜单Tools - Device Manager: 点击设备…

Vue列表渲染

1,回顾HTML列表? 答:列表分为顺序列表ol,无序列表ul,用于在网页上以表格的形式进行数据展示,数据放在单元格之中,可以用于布局或者展示某个具体对象的信息。li表示列表的每一项。自定义列表为dl…