山海大模型亮相,云知声交出AGI第一份答卷

news2025/1/31 11:30:40

有人说,AI大模型是少数巨头才能玩得转的游戏。

截至目前,认同此观点的人不在少数。自从ChatGPT去年迅速火遍全球之后,忽如一夜春风来,AI大模型遍地开。Google、Amazon、阿里、百度等巨头们纷纷加入AI大模型的“军备竞赛”,似乎预示着市场在向大公司集中。

但事实真是如此么?且不说国外Anthropic、Cohere等生成式AI独角兽公司在市场中表现极为活跃,国内也有不少AI公司从不同角度切入AI大模型的市场竞争中,市场呈现出百花齐放的景象。

近日,国内AI独角兽云知声交出了在AI大模型领域的第一份答卷--山海大模型。云知声对外全面展示了山海大模型语言生成、语言理解、知识问答、逻辑推理等十项能力,并且山海大模型在MedQA评测、临床执业医师资格考试等医疗领域测试成绩处于业界领先。

 云知声用实际行动表明,AI大模型的市场竞争才刚刚开启,只有大公司才能玩得转的谬论可以休矣。正如云知声创始人、CEO黄伟所言:“云知声将持续升级山海大模型的能力,目标是年内通用能力比肩ChatGPT,并在医疗、物联、教育等垂直领域超越GPT4。”

如何才能做好AI大模型

纵观AI模型的发展历程,经历了从大练模型到练大模型的阶段。如今,AI大模型场景凭借通用、泛化和规模化复制等诸多优势,被业界视之为实现 AGI(通用人工智能,Artificial General Intelligence)的重要路径。

而人们之所以看好巨头们在AI大模型的前景,无非是巨头们具备雄厚的资金实力、庞大的研发队伍以及完善的基础设施等优势。

这些条件固然是研发AI大模型的关键因素,但并不是决定性因素。事实上,OpenAI的成功恰恰表明,AI大模型的研发本质上是多种算法的组合+正确的训练方法,考验的是基础设施+数据+算法的综合工程化能力,这种综合能力并非是巨头们的专属。

比如,AI大模型的训练极其考验算力,但并不意味着算力堆砌越多越好、越强越好。正所谓韩信点兵、多多益善,AI大模型需要源源不断的算力,但更加需要能够运筹帷幄的“韩信”。云知声创始人、CTO 梁家恩直言:“大力能够出奇迹,但蛮力出不了奇迹。”

据悉,云知声属于较早重视算力基础设施建设与投入的AI公司,从2016年开始不断布局算力等基础设施,构建起高效架构+全栈算法的超算集群Atlas,成为东南地区最大的超算集群之一。云知声山海大模型从去年底启动,今年2月底就研发出第一版,短短半年内正式对外发布,离不开超算集群Atlas的鼎力相助。

又如高质量的数据集和科学的训练方法直接影响着大模型的效果,这考验着AI公司的数据积累、数据处理以及训练数据的工程化能力。OpenAI 《Scaling Laws for Neural Language Models》伸缩法则就强调了增加高质量数据集对于模型训练效果的重要性。OpenAI CEO Sam Altman也透露,OpenAI的数据集远比外界想象的大,并且大量工作围绕在数据工程层面。

同样,成立十年的云知声在数据积累和数据工程化方面有着丰富的积累,其UniScale训练推理一体化框架、UniDataOps数据优化并行处理框架在各种场景中久经考验。梁家恩就透露,除了开源英文语料类别和中文语料类别之外,云知声在训练山海大模型还增加了多年积累的中文和医疗数据。

所以,云知声能够在半年内完成算力扩容、算法验证、并行加速、数据优选等工作,实现GPT为核心的架构升级和成功发布山海大模型。黄伟直言,AI大模型是AI领域的一场“工程革命”,将过去各种AI技术进行整合和综合应用,逐步实现大模型从量变到质变。

山海交出的答卷如何

众所周知,过去几个月里,国内AI大模型层出不穷,但表现也是参差不齐,甚至还闹过“宫保鸡丁”梗、“套娃ChatGPT”等各种话题。

不过,AI大模型出现回答错误实属正常,因为涉及到数据集质量、训练时长等各种因素。因此,大家都很好奇,云知声在短时间内训练出的山海大模型到底表现如何?

根据云知声介绍,山海大模型具备十大能力:即语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力七项通用能力及插件扩展、领域增强、企业定制三项行业落地能力。

 

大数据在线也对山海大模型进行了一番测试,包括逻辑推理、数学运算、代码能力等,整体表现优秀,遇到逻辑问题时候能够很清晰和准确的给出答案。

开放式知识问答,山海大模型在连续追问的情况下,能够给出准确的答案,表现令人惊艳。

 

 数学运算,山海大模型能够很好理解题目的含义,并且转换为计算公式进行计算和得出正确结果。

 

逻辑推理,针对各种逻辑问题,山海大模型能够有效判断问题的关键,并给出合理解释。

 代码能力,山海大模型有较强的代码生成能力。

 人类价值观对齐

值得关注的是,山海大模型还准备了计算器、天气查询、Web搜索、发现周边等丰富的插件功能,用户可以通过丰富的插件功能来获得更加准确的信息。

整体来看,山海大模型的通用能力让人较为满意。比如,在开放式知识问答方面,山海大模型能够准确理解问答含义和给出正确答案,并且在连续追问的情况下,能够连贯性的回答;又如,在逻辑推理方面,山海大模型针对一般性推理问题回答都能游刃有余,很少掉入“陷进”之中;再如,针对“不健康网站”的陷进问题,山海大模型的回答能够有效避坑,并且连续追问下去可以给出相应的解决方案,符合人类价值观的对齐。

无疑,山海大模型的出色表现,也给了云知声极大的信心。“山海大模型目标是年内通用能力比肩ChatGPT。”黄伟如是说。

在To B开启大模型价值之路

当前,AI大模型已经在互联网场景中小试牛刀,从ChatGPT成为史上最快达到亿级用户的App,到互联网企业利用互联网技术与搜索引擎结合,互联网公司普遍都在利用AI大模型重塑自己的产品。

除了To C之外,AI大模型在To B领域的拓展亦开启了人工智能的商业化价值之路。IDC统计,过去两年中国人工智能在各行业的渗透率均不断提升。其中,电信、金融和制造业的渗透率提升幅度靠前,超过4%;教育、能源和医疗等行业绝对渗透率较低,未来提升空间巨大。预计到2026年,人工智能行业渗透率有望达到20%。

众所周知,从数字经济、数字中国建设的大趋势来看,产业数字化、行业智能化升级是一块重要拼图,这其中AI大模型在行业中的应用又是最重要抓手。黄伟直言:AI大模型为人工智能带来了新的能力,可以打造更多产品来满足行业用户对于智能化的需求。

事实上,AGI在行业场景的应用前景广阔,却也绝非易事。在笔者看来,云知声的U+X战略(U:AI技术和产品能力, X:行业应用场景)为AI大模型、AGI在行业的深耕开辟出一条价值之路。

笔者认为,云知声U+X战略的好处就是能够将数据、应用和模型连接起来,形成类似飞轮。首先在行业中寻找到合适的场景,然后通过用户行为反馈积累特定的有效数据,再反哺AI大模型;AI大模型的不断迭代与优化,则有利于AGI在行业中的进一步应用和收集更多有效数据,从而形成飞轮效应,越到后面大模型效果会更好。

以医疗领域为例,属于复杂度和知识密度极高的行业,云知声U+X战略在医疗行业的深耕,使得其山海大模型在医疗领域着实惊艳了一把。在发布会现场,云知声演示了在山海大模型的辅助下,基于病历辅助医生生成完整的病历方案、辅助医疗相关理赔等多个场景,大幅提升了业务效率和智能化程度。此外,在MedQA 测评中,山海大模型以 81.56%位居第一,超过GPT4、Med-PalM等模型;在临床执业医师资格考试中,山海大模型得分高达511 分,远超平均分和及格线。

 据悉,山海大模型接下来将在国内头部三甲医院陆续落地。可以想象,随着山海大模型在更多医疗场景中的应用,通过学习更多医疗数据,未来有望进一步提升AGI在医疗场景的应用范围和深度。除了医疗领域之外,云知声还演示了山海大模型在销售、知识管理、教育、智慧物联等场景的应用。

“从长远来看,AI大模型将成为AI 2.0时代的‘发电厂’,大数据是燃料、算力是锅炉、算法则是发电机,未来使用大模型类似用电那样便捷与方便。”黄伟补充道。

为什么看好云知声

当前,AI大模型属于一拥而上的情形,既有互联网、云计算等巨头们,也有新成立的AI企业,更有像云知声这样深耕AI领域多年的独角兽。可以预见,未来AI大模型市场的竞争会愈发积累。

那么,面对未来激烈的市场竞争,云知声的前景如何?在笔者看来,从人工智能市场前景、云知声的战略以及核心能力来判断,云知声有望在市场中不断突破,实现自我超越。

首先,在数字经济和数字中国建设的大背景下,为云知声提供了极为广阔的市场舞台。IDC预计,中国人工智能市场规模在2023年将超过147亿美元,到2026年将超过263亿美元,市场增量将主要源于基于大模型的应用替换过去几年建设的AI应用、生成式AI带来的增量市场和全新的AI赋能的企业级应用。

 其次,云知声过去十年坚持的U+X战略被证明是一条艰难但正确的AI商业化之路。随着AI大模型时代的到来,无疑让云知声U+X战略如虎添翼,有利于加速了AGI在行业的商业化,以及有望打开更加广阔的行业市场。

第三,山海大模型的惊艳两项,证明云知声深厚的数据积累和工程化能力是业界一流,这也是云知声十年实践积累的核心优势。随着OpenAI走出一条AI大模型之路,云知声凭借数据积累和工程化能力等核心优势,也有望跟上甚至超越。

综合观察,AI大模型正在步入战国时代,市场竞争格局远未确定。而AI独角兽云知声在短短半年内打造出山海大模型,充分证明中国的AI企业一样能打。面向未来,AI大模型和AGI在行业应用之路曲折却光明,而云知声有望凭借自身优势,让山海大模型逐云破浪、扬帆远航。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/587709.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据分享】1929-2022年全球站点的逐日平均气温数据(Shp\Excel\无需转发)

气象数据是在各项研究中都经常使用的数据,气象指标包括气温、风速、降水、湿度等指标,其中又以气温指标最为常用!说到气温数据,最详细的气温数据是具体到气象监测站点的气温数据!本次我们为大家带来的就是具体到气象监…

大数据分析案例-基于决策树算法构建世界杯比赛预测模型

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

EMC VNX Unified Storage 关机顺序方法

EMC Unfied的VNX存储系统要比单纯的Block系统复杂很多,相当于是两套存储系统,不管在物理硬件上还是逻辑的软件OS上,都复杂很多很多。 客户经常遇到由于机房停电或者机房搬迁等情况,需要对存储系统做关机下电甚至物理搬迁的动作&a…

FPGA基于AXI 1G/2.5G Ethernet Subsystem实现UDP通信DMA传输 提供工程源码和技术支持

目录 1、前言2、我这里已有的UDP方案3、详细设计方案传统UDP网络通信方案本方案详细设计说明DMA和BRAMAXIS-FIFOUDP模块设计UDP模块FIFOAXI 1G/2.5G Ethernet Subsystem:输出 4、vivado工程详解5、上板调试验证并演示注意事项 6、福利:工程代码的获取 1、…

【simple-cache】一款只用一个注解就实现缓存的框架-我们终于迎来了SpringBoot版本

上次我们讲了【simple-cache】的使用: 【simple-cache】我开发了一款只要一个注解就可以轻松实现缓存的框架 这次主要更新的内容为: 添加springboot项目框架中去除了redisconfig类,避免了redis的单机和集群问题用户可以自定义使用自己项目中…

Python之字符串(str)基础知识点

strip() 删除指定字符 当token为空时,默认删除空白符(含’\n’,‘\r’,‘\t’,’ ),当非空时,根据指定的token进行删除。 字符的删除又可分为以下几种情况: string.strip(token):删除string字符串中开头(left)、结尾处(right)的…

【操作系统】02.进程管理

多道程序系统 多道就是将多个程序同时装入内存,使之并发运行。操作系统也是基于多道产生的,提高了资源利用率和系统吞吐量。 进程 定义 进程是程序的一次执行 进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位 在引入线…

会流程图却不会UML活动图?活动图深度剖析,就怕你学不会!

1. UML活动图是啥? 也许很多人都不怎么了解活动图,但是却对流程图很熟悉,你暂且可以简单的把活动图理解为UML里的流程图,用来描述系统的行为特征。不过UML活动图对比于流程图来说也存在不少差异,本文将在第三章节讲解活…

解决 MobaXterm X11 server 打开 wsl2 linux 子系统 rviz 可视化窗口卡顿问题

1、问题 环境: MobaXtermwsl2 Ubuntu-18.04ROS1Intel 核显 一直使用 MobaXterm 这个远程软件 ssh 链接 linux 服务器,因为它集成了 X11 server,即可以显示一些 linux 下有图形化界面的程序,如 ROS 的 rviz 等。 但是 MobaXterm…

宝塔面板一键部署Z-Blog博客 - 内网穿透实现公网访问

文章目录 1.前言2.网站搭建2.1. 网页下载和安装2.2.网页测试2.3.cpolar的安装和注册 3.本地网页发布3.1.Cpolar临时数据隧道3.2.Cpolar稳定隧道(云端设置)3.3.Cpolar稳定隧道(本地设置) 4.公网访问测试5.结语 转发自cpolar极点云的…

一步一步的实现使用 Tensorflow Hub 进行图像分割

在本文中,我们将学习如何使用 TensorFlow Hub中提供的预训练模型执行语义图像分割。TensorFlow Hub 是一个库和平台,旨在共享、发现和重用预训练的机器学习模型。TensorFlow Hub 的主要目标是简化重用现有模型的过程,从而促进协作、减少冗余工…

[比赛简介]ICR - Identifying Age-Related Conditions

比赛链接:https://www.kaggle.com/competitions/icr-identify-age-related-conditions 比赛简介 本次比赛的目标是预测一个人是否患有三种疾病中的任何一种。您被要求预测该人是否患有三种疾病中的任何一种或多种(1 类),或者三种…

第14届蓝桥杯Scratch选拔赛(STEMA) 真题集锦

一、选择题 第 1题单选题 运行以下程序 (小象仅有两个造型),小象的造型是哪个? () 答案 A 解析 本题正确答案是A,考察的知识点是角色造型,在Scratch中,切换造型有两个指令,分别是“换成xx造型“和“下一个造型”,其中前者将角色切换为指定造型,而后者则从当前造型切换…

面向小白的最全Python数据分析指南,超全的!

因工作需求经常会面试一些数据分析师,一些 coding 能力很强的小伙伴,当被问及数据分析方法论时一脸懵逼的,或者理所当然的认为就是写代码啊,在文章开头先来解释一下数据分析。 数据分析是通过明确分析目的,梳理并确定…

虎牙在全球 DNS 秒级生效上的实践

博主介绍:✌全网粉丝4W,全栈开发工程师,从事多年软件开发,在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战、定制、远程,博主也曾写过优秀论文,查重率极低,在这方面…

六级备考18天|CET-6|写作第一讲|现象解释|10:00~10:45

目录 1. 议论文类型 现象解释 what,why,importance 观点选择 whether,choice,option 问题解决 how to,measures 图片图表 image,cartoon,diagram,chart 2. 基本题型 议论文、图表、谚语 3. 模版构成/段落结构划分 三个段落:10-11句 背景主题句过渡句 …

电加热道岔融雪系统设备

设备构成 融雪设备由道岔融雪远程控制中心工作站(以下简称工作站)、道岔融雪车站控制终端(以下简称控制终端)、道岔融雪控制柜(以下简称控制柜)、钢轨温度传感器、电加热元件、道岔融雪隔离变压器(以下简称隔离变压器)等组成。 01集中供电方式 02分散供电方式 设备型号及含义…

本地新建项目,git 到gitlab中

目录 1、首先,gitlab中,创建一个空项目 2. 本地项目上 操作 1) git init 2) 关联远程仓库 3)git pull 4) 查看远程分支 5)指定git pull 远程哪个分支 6)关联远程分支 7) .gitignore …

批量处理同列的相同值,合并成一个单元格

效果 易错点 选中公司部门的时候,选择是数据的开始的第一行和最后一行居中和合并完后,选择的也是公司部门的数据开始第一行和最后一行; 操作方法 1、 鼠标悬浮到你要合并的任意一栏 2、 选择菜单-数据汇总 3. 这两个值,要选择要分组的列名,求和方式…

【Unity】基于GLTFUtility插件加载gltf格式数据

C#代码:JSON数据解析 一、环境配置1. GLTFUtility项目git地址2. 安装支持工具:搜索Newtonsoft.Json并安装 二、代码调用1. 单线程加载GLTF/GLB2. 多线程加载GLTF3. 多线程加载GLB 三、加载参考案例1. 创建基础UI2. 挂接脚本到ReaderGLTF对象3. 加载结果 …