国产AI大模型酣战,科大讯飞打响“智慧涌现”第一枪

news2024/9/27 17:29:07

配图来自Canva可画

ChatGPT问世半年之久,人与AI“你问我答”的游戏热度不降反升,AI大模型技术需求也随之水涨船高,成为科技企业重点关注的方向。

在海外,OpenAI、谷歌、微软的AI大模型战争正打得火热;在国内,科大讯飞、百度、阿里、腾讯、华为等科技巨头纷纷拥抱AI大模型。它们基于自身智能技术积淀,争先发布AI大模型成果,掀起了一波AI大模型技术浪潮。

5月6日,科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并公布大模型年内三次升级时间点,称10月底将整体赶超ChatGPT,再次引发了国产AI大模型热潮。

国产AI大模型渐入佳境,实力玩家激战正酣

ChatGPT爆火后,国内AI大模型领域按下了“快进键”,科技企业争分夺秒研发AI大模型,国产AI大模型市场呈现多方混战的景象。

一方面,AI大模型是科技企业的“新造梦场”,也是神仙打架现场,没有技术积淀也没有资金实力的玩家终会被淘汰,市场格局将逐渐明朗。

眼下AI大模型创业如火如荼,除了科大讯飞、百度、阿里等知名选手之外,还有一些名不见经传的跨界玩家前来凑热闹。然而AI大模型研发不是简单地堆砌数据、算力和算法,而是复杂的系统性工程,对企业技术能力、资金实力均有高要求,市场混战很快将会过滤掉“噱头玩家”。

另一方面,科技企业的起点不同,竞争分化现象会更明显,随着竞争加剧,“头部阵营”内部也会产生分化,实力更强者将从中脱颖而出。

优胜劣汰的过程没有止境,即便科大讯飞、百度、阿里等具备可研发AI大模型的能力,但企业实力不同,强者与强者之间也要分AI大模型研发速度快慢和产品质量的高低,AI大模型创业浪潮既可卷走弱者,也可锻造强者。

表面来看,科技企业角逐AI大模型是一场“追风行动”,更深层次实则是为了抢夺下一个科技时代的入场券,技术、场景、生态则成为了这场AI大模型竞争制胜的关键。

技术大比拼

众所周知,AI大模型是“大数据+大算力+强算法”结合的产物,科技企业的技术底座决定了其AI大模型的应用价值,因而AI大模型入门资质是科技实力,技术比拼不可避免。

科大讯飞、阿里在AI大模型领域均有深厚技术积累,从各自发布的讯飞星火认知大模型、阿里通义大模型就可窥见其技术功底。

讯飞星火认知大模型在七个维度测评中的表现可圈可点,特别是数学、长文本生成、语义理解等三项能力媲美甚至超过ChatGPT和其他同行。

不仅能回答出“我想把40㎡的房子装修成70㎡的感觉,请给出可行的方案”此类刁钻问题,还能解答算术题“等腰三角形的顶角是底角度数的2倍,请问这个三角形的底角是多少度?”,写散文、写代码、语言翻译都信手拈来。

究其原因,和长期的技术积淀有关,科大讯飞2011 年承建语音及语言信息处理国家工程实验室,2014年开启“讯飞超脑计划”,2017年承建认知智能国家重点实验室,2022年升级“讯飞超脑2030计划”……深耕认知智能领域近十年,在AI大模型所需的数据、算力、算法和模型等方面上已经先行一步。

在数据方面,科大讯飞通过十几年AI技术研发和技术落地推广生涯,积累了超50TB的行业语料和每天超10亿人次用户交互的活跃应用。在算法和模型方面,科大讯飞专研认知智能大模型最核心的Transformer深度神经网络算法,语音识别和图文识别技术全球领先;在算力方面,科大讯飞自建4城7中心深度学习计算平台,为AI大模型构建了坚实的算力底座。

此外,科大讯飞能够屡屡交出让人眼前一亮的答卷,其背后连年剧增的研发投入和超高的研发人员占比起到了关键作用。

据科大讯飞财报数据显示,2022年研发投入为33.6亿元,同比提升14.28%,研发投入占营收的比例为17.83%,较2021年提高1.8个百分点。截至2022年末,科大讯飞研发人员达9281人,占公司总人数比例为61.68%,占比提升3.2个百分点。

无独有偶,阿里的大语言模型“通义千问”,背后的技术积累一样颇为深厚。阿里达摩院在人工智能领域布局多年,形成了从飞天云操作系统、芯片到智算平台的“AI+云计算”的全栈技术能力,为阿里AI大模型的训练和运行提供了强大的算力、算法和数据基础。

如此看来,讯飞星火认知大模型、阿里通义大模型皆是多年技术积累的结晶,证明了大模型技术门槛并非普通科技公司可以达到。

全场景较量

技术之外,场景也是AI大模型厂商的重要战场。AI大模型的演进升级需要高质量的内容数据作支撑,而有了丰富的应用场景,大量数据自然会产生,且技术始终要为场景服务,场景的重要性不言而喻。

为了积累更多内容数据,也为了给用户带来全新的体验,AI大模型厂商在探索大模型落地的道路上做了很多尝试,而落地布局逻辑大致上遵循一个思路:从自家主要业务入手,再延伸覆盖千行百业。

科大讯飞星火大模型最先应用于教育、办公、汽车驾驶、数字员工等场景,升级产品智能化功能,极大程度改善了用户体验。

在教育领域,讯飞星火大模型+学习机(科大讯飞AI习机T20),可以AI写作批改、精细批改、给优化参考,俨然成为学生的智能家庭教师。在办公领域,讯飞星火大模型+办公(讯飞听见、讯飞智能办公本X2),可以自动会议纪要、自动语篇规整、一键成稿,是职工的智能办公助理。

在汽车驾驶领域,讯飞星火大模型+智能座舱,可以提供多轮、多人、多区域、多模态智能汽车人机交互范式,强化智能座舱的科技体验感。在数字员工领域,讯飞星火大模型+数字员工,优化了数字员工语音和文本交互体验……

总之,科大讯飞围绕自身业务优势去落地AI大模型技术,不仅对学习机、办公本、智能座舱等智能产品进行全面升级,增强了产品竞争力,还加快了AI大模型规模化落地的效率,达成一个双赢的状态。

同样地,华为专注于“AI赋能产业”,华为盘古系列AI大模型(NLP大模型、CV大模型、科学计算大模型)在远程协作、自动驾驶、智慧城市等多个产业释放AI能力,助力行业降本、增效、提质。

AI大模型技术落地处于初步探索阶段,各大AI大模型厂商正积极抢占“空白场景”,而AI大模型技术发展到一定水平之后,AI大模型也将随之进入应用场景爆发阶段,届时围绕全场景的争夺会越来越激烈。

生态位争夺

随着竞争升维,AI大模型将逐渐由单一的技术与场景之争,转向产业生态的竞争,这就要求科技企业持续完善AI大模型生态。为此,科大讯飞和百度不约而同的选择通过“技术开放”,与数据资源方、场景应用方建立合作关系,打造坚实的生态壁垒。

在内部,科大讯飞基于自身业务资源,加快AI大模型与垂直行业深度融合,丰富AI大模型生态。在外部,科大讯飞携手各大合作伙伴共建、完善和拓宽AI大模型生态圈。

一方面,科大讯飞多元化业务是拓展AI大模型生态的重要资源。科大讯飞的业务广而大,智慧教育、智慧城市、智慧汽车、智慧医疗、智慧金融等垂直领域的硬件产品和APP全面接入AI大模型技术,可提高AI大模型技术的落地效率和效果。

另一方面,科大讯飞持续开放AI大模型技术、连接生态合作伙伴,通过合作的方式快速扩大生态规模,做大做强AI大模型生态。比如,讯飞星火算力硬件主要由华为提供,这两大强者交流合作、经验借鉴,形成良性竞争和互补发展的局面。

据悉,讯飞开放平台新增星火认知大模型,为开发者和合作伙伴提供更具价值的AI应用,首批来自36个行业的3000余家企业开发者将接入星火大模型。此外,目前讯飞开放平台已经开放了560项AI能力,并聚集了超过500万生态合作伙伴。

和科大讯飞一样,百度坚持技术创新及开放生态,试图通过技术赋能降低AI大模型技术开发和应用的门槛,为各行各业的数智化转型升级打造坚实的技术底座。目前,百度通过飞桨开源开放平台、百度智能云等平台,将文心大模型赋能到多个行业,并且个人、企业开发者数量超6万。

科大讯飞、百度试图通过AI大模型技术输出连接生态伙伴,构建生态壁垒,从而增强企业竞争力,以期在未来竞争中赢得有利位置。接下来,AI大模型厂商竞争的主旋律将是:找准生态位,守住生态位。

AI星星之火,带动“智慧涌现”燎原之势

众所周知,当AI大模型突破某个数据规模时,性能会得到显著提升,进而呈现“智慧涌现”现象。那么,哪些科技企业有望在中国实现智慧涌现?

很明显,从技术、场景、生态等竞争维度来看,最有可能胜出的一类是以科大讯飞为代表的长期深耕AI技术的科技公司;另一类是以阿里、华为、百度等资金实力雄厚的互联网公司。

首先,这些玩家推动AI大模型深入应用于千行百业,将创造更多智慧涌现的机会。例如,科大讯飞继续推动“1+N”认知大模型专项攻关,为各行各业AI大模型技术赋能,会面临很多新挑战以及新机遇,而攻克落地难关的过程,充满智慧涌现的机会。

其次,算力、算法、数据等基础支撑能力越来越强,将大大提升AI大模型升级迭代速度,点亮智慧涌现曙光。数字经济高速发展,基础设施建设不断完善,将提高算力供给能力,驱动AI大模型汲取更多数据反复试验和学习,最终将实现算力、算法和数据规模的突破。

最后,科技巨头们的激烈博弈,无疑将进一步推动AI大模型生态的发展,加速“智慧涌现”时代的到来。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/504552.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PowerShell系列(二):PowerShell和Python之间的差异介绍

目录 1、Python定义 2、Python用途 4、PowerShell用途 5、PowerShell和Python对比 5.1 共同点 5.2 不同点 6、总结 今天给大家聊聊PowerShell和Python之间有哪些共同之处,各自有哪些优势,希望对运维的朋友了解两种语言能提供一些有用的信息。 1、Python定…

Unit 为啥还能当函数参数?面向实用的 Kotlin Unit 详解

视频先行 下面是视频内容的脚本文案原稿分享。 文案原稿 很多从 Java 转到 Kotlin 的人都会有一个疑惑:为什么 Kotlin 没有沿用 Java 的 void 关键字,而要引入这个叫 Unit 的新东西? // Java public void sayHello() {System.out.println(&qu…

Unity大面积草地渲染——2、草地的动态交互

大家好,我是阿赵。 这里继续讲大面积草地渲染的第二个部分,草地动态交互。这里主要有风吹效果和球体碰撞效果2种。 一、风吹效果 Unity使用shader控制草的渲染和动画 风吹动草的效果,主要还是使用顶点程序来控制顶点的偏移 回顾一下之前的基…

全方位揭秘!大数据从0到1的完美落地之Shuffle和调优

MapReduce高级 shuffle阶段 概述 MapReduce会确保每个reducer的输入都是按键排序的。从map方法输出数据开始、到作为输入数据传给reduce方法的过程称为shuffle。在此,我们将学习shuffle是如何工作的,因为它有助于我们理解工作机制(如果需要…

MYSQL数据库进阶多表查询,MYSQL数据库主键和外键

目录 友情提醒第一章:MYSQL数据库多表主键和外键1)外键介绍(FOREIGN KEY)2)外键约束作用2)三种情况下添加外键约束①一对一关系②一对多关系多对多关系 4)删除外键约束 第二章:MYSQL…

配置您的 Web 服务器以包含 X-Frame-Options 标头

介绍 X-Frame-Options HTTP 响应头是用来给浏览器指示允许一个页面可否在 <frame>, </iframe> 或者 <object> 中展现的标记。网站可以使用此功能&#xff0c;来确保自己网站的内容没有被嵌套到别人的网站中去&#xff0c;也从而避免了点击劫持 (clickjackin…

mysql数据库之备份和恢复

1.数据备份的重要性 备份的主要目的是灾难恢复。 在生产环境中&#xff0c;数据的安全性至关重要。 任何数据的丢失都可能产生严重的后果。 造成数据丢失的原因&#xff1a; 程序错误人为,操作错误,运算错误,磁盘故障灾难&#xff08;如火灾、地震&#xff09;和盗窃. 2.数据…

Python爬虫入门之爬虫解析提取数据的四种方法

本文主要介绍了Python爬虫入门之爬虫解析提取数据的四种方法&#xff0c;通过具体的内容向大家展现&#xff0c;希望对大家Python爬虫的学习有所帮助。 基础爬虫的固定模式 笔者这里所谈的基础爬虫&#xff0c;指的是不需要处理像异步加载、验证码、代理等高阶爬虫技术的爬虫…

Vscode开发第一个Vue+Element Plus示例

Vscode开发第一个VueElement Plus示例 目前&#xff0c;前端开发工具非常多&#xff0c;如Webstorm、Atom、HBuilder、Visual Studio Code、Sublime Text、Notepad等。对于有经验的开发者来说&#xff0c;使用哪一款工具都可以。笔者习惯使用Visual Studio Code。 Visual St…

什么是镜像?阿里云服务器镜像是什么?镜像怎么选?

阿里云服务器镜像就是云服务器的装机盘&#xff0c;镜像是为云服务器安装操作系统的。阿里云镜像分为类型分为公共镜像、自定义镜像、共享镜像、云市场镜像和社区镜像&#xff0c;如下图&#xff1a; 目录 什么是镜像&#xff1f; 镜像种类说明 公共镜像 自定义镜像 共享…

【HarmonyOS】轻量级智能穿戴应用如何在页面中实现数据传递与全局变量的使用

【关键词】 轻量级智能穿戴、LiteWearable、数据传递、全局变量 【问题描述】 开发轻量级智能穿戴LiteWearable应用&#xff0c;在app.js中定义全局变量&#xff0c;在页面中通过this.$app.$def.xxx获取时&#xff0c;报错TypeError: Cannot read property $def of undefined…

FlinkTableAPI与SQL编程实战

FlinkTableAPI与SQL编程实战 接下来我们一起来进入到FlinkSQL的编码实战当中&#xff0c;通过代码来实现FlinkSQL的编码开发 1、Flink TableAPI实践 1.1、创建Maven工程 并添加以jar包坐标依赖 <properties><maven.compiler.source>8</maven.compiler.source…

Spring Redis 启用TLS配置支持(踩坑解决)

由于线上Redis要启用TLS,搜遍了google百度也没一个标准的解决方案,要不这个方法没有,要不那个类找不到...要不就是配置了还是一直连不上redis.... 本文基于 spring-data-redis-2.1.9.RELEASE 版本来提供一个解决方案: 1.运维那边提供过来三个文件,分别是redis.crt redis.key …

设计模式 -- 解释器模式

前言 月是一轮明镜,晶莹剔透,代表着一张白纸(啥也不懂) 央是一片海洋,海乃百川,代表着一块海绵(吸纳万物) 泽是一柄利剑,千锤百炼,代表着千百锤炼(输入输出) 月央泽,学习的一种过程,从白纸->吸收各种知识->不断输入输出变成自己的内容 希望大家一起坚持这个过程,也同…

易基因:精原干细胞移植后出生小鼠子代中的精子DNA甲基化变化机制|新研究

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 精原干细胞移植&#xff08;Spermatogonial stem cell transplantation&#xff0c;SSCT&#xff09;被提议作为儿童癌症幸存者的生育疗法。SSCT首先冷冻保存睾丸活检&#xff0c;然后再…

【2023 · CANN训练营第一季】应用开发深入讲解——第二章 模型推理

学习目标 学习资源 内存管理 在线课程 文档 模型推理 文档 第1节 AscendCL运行资源管理 运行资源管理概述 申请运行管理资源时&#xff0c;需按顺序依次申请&#xff1a; Device 、 Context 、 Stream &#xff0c;然后根据实际需求调用 aclrtGetRunMode 接口获取软件栈的…

黑马Redis实战项目——黑马点评笔记06 | 好友关注

黑马Redis实战项目——黑马点评笔记06 | 好友关注 1、关注和取关2、共同关注2.1 查看他人主页2.2 查询共同关注A 改造关注和取关功能B 求交集 3、关注推送3.1 Feed 流分析3.1.1、拉模式&#xff08;读扩散&#xff09;3.1.2、推模式&#xff08;写扩散&#xff09;3.1.3、推拉结…

C++ JPEG编码

依据上一篇的JPEG编码所得到的RGB信息&#xff0c;我们可以重新对RGB图片进行编码&#xff0c;也可对其他图片如BMP所得到的RGB信息进行编码,来得到*.jpg文件&#xff0c;注意我这里实现的JPEG编码不知道为啥编码出来的文件比原来大了好多。 还有要注意的地方&#xff0c;下面会…

【计算机三级网络技术】 第六篇 交换机及其配置

文章目录 IPS&#xff08;入侵防护系统&#xff09;相关知识点蓝牙服务器技术DNS 服务器WWW 服务器FTP 服务器邮件&#xff08;Winmail 邮件服务器&#xff09;生成树协议IEEEVLAN 标识的描述DHCP 服务器 IPS&#xff08;入侵防护系统&#xff09;相关知识点 1、入侵防护系统&…

迅为i.MX6ULL开发板生成 KEY 文件,并安装

使用“ssh-keygen” 生成个四个 key 文件“ssh_host_rsa_key” “ssh_host_dsa_key” “ssh_host_ecdsa_key” 和“ssh_host_ed25519_key” 。 1 在虚拟机 Ubuntu 控制台&#xff0c; “ /home/ssh/openssh-4.6p1” 目录下&#xff0c; 使用命 令“ssh-keygen -t rsa -f ssh…