科大讯飞的2022:夯实“根据地”业务,以技术创新点燃大模型产业落地的“星星之火”...

news2024/10/5 14:04:07

95677272685e48df2cba0aeaf8db2db5.png

5935b2bd61b5a52c9424d77aaa9ed776.png

635d957767b9348d8fc2db4d8c648f72.png




‍数据智能产业创新服务媒体

——聚焦数智 · 改变商业


4月20日晚,科大讯飞正式公布2022年度及2023年度第一季度业绩报告。财报数据显示,公司2022年度实现营业收入188.20亿元,同比增长2.77%,实现毛利76.84亿元,较上年增长2.0%;归属于上市公司股东的净利润5.61亿元。2023年度第一季度科大讯飞实现营业收入28.88亿元,科大讯飞表示一季度攻关项目的新增投入影响了部分当期利润。

我们注意到,科大讯飞去年在教育、医疗等持续运营型根据地业务的合作平台拓展、新产品研发以及核心技术自主可控和国产化适配等方向新增投入约8亿元。科大讯飞表示,尽管上述投入在2022年尚未形成收入,影响了当期经营业绩,但对下一阶段盈利能力持续提升和产业领导者地位增强奠定了扎实基础。

此前科大讯飞发布消息称,”讯飞星火“大模型成果发布会将于5月6日召开,届时科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪将发布讯飞星火认知大模型,AI学习机、讯飞听见、智能办公本、智慧驾舱、开放平台等产品的最新升级成果也将同场亮相。

夯实根据地业务基本盘,以认知大模型引领技术创新

在4月20日举行的“2022年度及2023年第一季度业绩说明会”上,科大讯飞总裁吴晓如首先介绍了科大讯飞去年的业绩情况,以及对今年的公司发展进行了展望。

吴晓如表示,尽管整体营收仅呈现微增长,但根据地业务仍保持良好发展,毛利同比增长25%,毛利占比提升至58%,2022年“双减”校内课后服务新增了130个区县覆盖,共覆盖280个市区县平台,学习机流水型线下门店新增769家,教育考试业务新增12地市中考和2个省市高考,个性化学习手册新增300所运营校,智慧医疗新开拓96个区县,医保控费已在多个城市验证,AI检出率是传统模式成效的3-5倍,智慧汽车新增合作车型110个。

按科大讯飞此前的解释,“根据地业务”是指各个行业赛道中真正能够创造长期价值的业务,典型的根据地业务包括考试、学习机、个性化学习手册、智医助理、医保控费、智慧汽车等。

科大讯飞在2022年年度报告中称,通过2022年的踏实布局,依托根据地业务和系统性创新,2023年公司将在更加扎实的基础上,更高质量、更从容地实现奋斗目标,开启高质量发展新阶段。

ChatGPT被称为AI的“iPhone时刻”,以ChatGPT为代表的生成式AI让每个人命令计算机解决问题成为了可能,对于有能力、有资源投入的国内知名企业自然不会错过这一次发展机遇。

近期各大厂商的大模型像雨后春笋一般涌现出来,可谓是你方唱罢我登场。从3月16日百度打出第一炮以来,至少有百度、阿里巴巴、商汤、360、毫末智行、知乎、昆仑万维等知名公司召开发布会,官宣自研的大语言模型,腾讯、华为、字节跳动等巨头亦有相关的模型或方案。

对于大模型上的创新,本身就处于人工智能第一梯队的科大讯飞,其一举一动一直受到业内外的广泛关注。

实际上,早在2014年,科大讯飞便启动了“讯飞超脑”计划,逐步突破机器阅读理解、逻辑推理、 分析归纳、知识表达等技术难点,实现机器从能听会说到能理解会思考。

2022年,科大讯飞在人工智能关键核心技术领域累计摘取16项国际人工智能大赛的冠军,其中13项涉及常识阅读理解挑战赛OpenBookQA、QASC、ReClor等专业领域知名竞赛。另外,Transformer算法已广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务并达到国际领先水平,已开源6大类、超过40个通用领域系列的中文预训练语言模型,相关模型库月均调用量超1000万。

00fc6e8c48f65755e705c94fb59aaa4f.png
来源:科大讯飞

科大讯飞之所以能在人工智能关键技术产生创新优势,与其在人工智能研发持续投入不无关系。我们从2021年和2022年的财报中可以看出,尽管收入增长有快有慢,但其研发投入始终保持在一定比例,2021、2022年研发投入占营业收入比例分别为16.03%和17.83%。

另外,从人员上更可以看出,科大讯飞始终坚持科技公司的本色,2022年研发人员更是达到了9281人,占全体员工人数的61.68%,是销售人数的2.71倍。刘庆峰在发布会上表示,一大半研发人员都会和认知大模型的突破带来的创新有关联。

科大讯飞大模型的竞争优势和切入点在于专业领域

据悉,在5月6日科大讯飞“星火”认知大模型的发布,不仅包含通用大模型,更值得关注的是面向教育、医疗、办公、车载等行业的解决方案。

实际上,在ChatGPT全面爆发之前的去年12月,科大讯飞就启动了“1+N 认知智能大模型技术及应用”专项攻关,其中“1”指的是通用认知智能大模型算法研发及高效训练方案底座平台,“N”指的是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。在发布会上,吴晓如表示,科大讯飞有信心在国内认知大模型研发中处于技术前列,同时在教育、医疗等多个行业率先深度应用。

艾瑞研究表明,通用基础大模型在垂直专业领域的内容输出能力较弱且在产出结果的可信程度上不可控,需要垂直领域know-how与数据调优。与此同时,大模型产品也有机会嵌入各企业服务系统中进行升级改造,包括知识检索、数据分析、辅助编程、数字员工、交互硬件、数字人等企业级应用都有可能被重构。

科大讯飞在多年认知智能系统研发推广中积累了丰富的行业数据,为认知智能大模型的研发和专业领域优化提供了扎实基础,具备了行业公信力。并且,讯飞在牵头国家专项、国产化训练推理平台建设和优化方面持续投入,构建了扎实的竞争壁垒。

据了解,科大讯飞在多年认知智能系统研发推广中已积累了超过50TB的行业语料和每天超10亿人次用户交互的活跃应用,尤其是在教育、医疗、翻译等领域,在严格遵守适用法律法规前提下,为训练实现达到人类专家水平的行业认知大模型提供了海量行业文本语料和用户反馈数据,也为基于大模型的创新应用研发和试点推广提供了专业场景保障。

以医疗行业为例,科大讯飞的“智医助理”是业内唯一通过国家职业医师资格测试的智能辅助诊断系统,辅助基层医生完成超过2亿份规范电子病历,电子病历书写规范率整体提升至90%以上,累计为基层医生提供5.3亿余次AI辅助诊疗建议。在医疗这种关系到人民生命安全的专业领域,容不得AI“一本正经地胡说八道”。

6a8092d42848f656fe3496f0225218d6.png
来源:科大讯飞

刘庆峰表示,从业内整体情况来看,更大规模的大模型已经接近临界点,而科大讯飞在认知大模型推动过程中,突破点恰恰在于专业模型,借助其在专业领域大量积累的语料,首先形成强有力的专业模型,然后再把专业知识、语料相互衔接,在统一框架下,通过专业的子模型协同训练,从而获得更高、更可信的成效,最后形成通用大模型。

“我认为科大讯飞今天做认知大模型,并不是跟随GPT,而是有自己的逻辑。一方面我们与OpenAI将有一个赶超的过程,讯飞会通过专用领域达到并跑,甚至将来领跑,我们再由专业领域回过头来,在整个通用领域形成各自的优势。科大讯飞有机会在业内做出优势、在行业做到领先,我们对这个目标充满信心。“刘庆峰如是说道。

发布会上,多家券商分析师都提到如何将大模型的能力运用在现有讯飞产品中,如何提升相关产品的商业价值。吴晓如表示,这方面正是讯飞发力的另一个重点,讯飞借助认知大模型将对现有的核心产品进行升级,全面提升产品应用的成效。他介绍说,星火认知大模型对讯飞现有企业服务产品提升主要有三个方面,具体包括:

人机交互体验显著提升:讯飞无论是在车载的交互、在很多行业的客服系统、智慧家庭等产品,目前语义理解的错误会大幅度下降,交付的效果会得到显著提升;

内容生成及批改辅导等产品功能跃升:包含英语的听说教学、AI学习机、讯飞听见、办公硬件等产品,都会受益于认知大模型技术;

个性化服务更加精准:主要包括因材施教解决方案、慢病管理、智医助理、个性化学习手册等精准服务,大模型都将显著提高现有产品的品质。

吴晓如继续表示,星火认知大模型的发布,除了会让产品成效显著提升以外,还会大幅降低现有讯飞产品的使用门槛。比如客服、英语听说,它们与多个内容资源都有所绑定,目前采用大量的定制资源,而当认知大模型全面发布之后,既会推动海量的客户来使用讯飞的产品,又可以广泛赋能开放平台百万级合作伙伴,如此将会带来互联网产业格局重塑的新机遇。

目前,科大讯飞已具有稳健良好的开发者团队基础,并围绕开发者群体持续构建生态。科大讯飞2022年度报告显示,截至该报告期末,讯飞开放平台已开放559项AI能力及场景解决方案,聚集398.1万开发者团队,总应用数达164.6 万,链接超过500万生态合作伙伴。

刘庆峰表示,科大讯飞将严格遵守网信办的要求,通过邀请的方式将大模型能力逐步开放给开发者,通过API赋能他们开发更多的应用。对于开发者,尤其是行业开发者来说,也会由此获得第一批将认知大模型通向产业应用的入场券。

讯飞认知大模型“1+N” 的技术红利未来会通过“平台+赛道”的商业逻辑逐步兑现。刘庆峰表示,讯飞在很多年前就一直在提“平台+赛道”, “平台”意味着开发团队通过API调用等方式获得星火大模型的各项能力,与平台之间按调用量付费、应用合作分成、流量分成及订阅付费等多种方式进行价值分享。“赛道”意味着大模型要赋能教育、医疗、办公、车载等行业,在这些领域形成专用模型技术领先和大规模商业应用互相促进的格局。

文:陆易斯/ 数据猿

3c295924308d83841c26e70b93d109a8.jpeg

4f8e658fa1e64a58cde3999813d7aa0e.png

b4da40e9dad7b937d822461f945b3e87.png

ec40941262f0767b9e081c683f239504.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/458970.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

局域网 - CSMA/CD

文章目录 1 概述1.1 局域网的拓扑结构 2 CSMA/CD2.1 三种监听算法2.2 冲突检测原理2.3 二进制指数后退算法 3 扩展3.1 网工软考真题 1 概述 1.1 局域网的拓扑结构 2 CSMA/CD 对 总线型、星型 和 树型 拓扑访问控制协议是 CSMA/CD(Carrier Sense Multiple Access/ …

Android硬件通信之 WIFI通信

一,简介 1.1 随着网络的普及和通信技术的发展,网络的传输速度也越来越快,wifi技术也还成为手机设备最基本的配置。我们可以通过wifi实现手机与手机之前的信息传输,当然也可以与任意一台有wifi模块的其它设备传输。 1.2 wifi与蓝…

mysql 命令集

数据库操作 查看库命令 show databases; 使用某个库(可以不用分号 ;) use 库名 查看库下所有的表 show tables; 显示一个表下的所有字段和类型 desc user(表名); 查看一个表的建表语句 show create table user\G 创建数据库db1 cre…

gitee教程精简版

$ git config --global user.name "Your Name" $ git config --global user.email "emailexample.com" 设置名字和邮箱 初始化 git init git add test.txt 将文件预先添加到git仓库 git commit -m "刚刚我创建了一个文本"提交给git仓库&#x…

Android硬件通信之 蓝牙Mesh通信

一,简介 蓝牙4.0以下称为传统蓝牙,4.0以上是低功耗蓝牙,5.0开始主打物联网 5.0协议蓝牙最重要的技术就是Mesh组网,实现1对多,多对多的无线通信。即从点对点传输发展为网络拓扑结构,主要领域如灯光控制等&…

物联仓储系统ZigBee组网原理

在嵌入式项目物联仓储系统中,使用cortexM0模拟仓库,cortex-A9模拟服务器,两块开发板之间使用ZigBee技术实现数据接收和发送,本文就介绍一下ZigBee组网的原理和相关步骤。 1.组网概述 组建一个完整的zigbee网状网络包括两个步骤&am…

VSCode连接远程服务器调试代码详细流程

文章目录 1.远程连接服务器2. 打开项目文件目录3. 配置调试环境 在研究人工智能项目时,很多时候本地机器性能不够,只能把代码拉倒服务器上,然后利用服务器资源来运行代码。遇到问题时需要调试,本文详细介绍利用VScode来调试远程服…

简述docker镜像制作:阿里云私服使用说明

阿里云私服使用说明 使用阿里云容器镜像服务 在使用docker时,为了方便管理docker镜像和版本迭代,咱们推荐有一个镜像服务器。这里我们比较推荐使用服务商提供的容器镜像服务,一来不用自己搭建私服,节省维护成本,二来带…

【算法学习】—n皇后问题(回溯法)

【算法学习】—n皇后问题(回溯法) 1. 什么是回溯法? 相信"迷宫"是许多人儿时的回忆,大家小时候一定都玩过迷宫游戏。我们从不用别人教,都知道走迷宫的策略是: 当遇到一个岔路口,会有以下两种情况&#xf…

vue组件之间的数据共享

1.组件之间的关系 在项目开发中&#xff0c;组件之间的最常见的关系分为如下两种: ① 父子关系 ② 兄弟关系 1.父向子传值---使用自定义属性 父组件向子组件共享数据需要使用自定义属性。示例代码如下: 父组件&#xff1a; <Son :msg"message" :user"…

使用AI优化慢SQL,开发秒变DBA

“AI不会替代他们&#xff0c;但善用AI的人会” 慢 SQL 经常会让应用程序响应变慢&#xff0c;轻者影响用户体验&#xff0c;严重的时候可能会导致服务不可用。如果&#xff0c;每次遇到慢 SQL 都求助于 DBA&#xff0c;一方面效率很低&#xff0c;另一方面也会很没面子。所以…

PowerShell批量修改、替换大量文件的文件名

本文介绍基于PowerShell语言&#xff0c;对文件夹中全部文件的名称加以批量替换、修改的方法。 在之前的文章基于Python一次性批量修改多个文件的文件名&#xff08;https://blog.csdn.net/zhebushibiaoshifu/article/details/115869725&#xff09;中&#xff0c;我们介绍了基…

为什么重写equals时必须重写hashCode()

不重写equals和不重写 hashCode()之前&#xff1a;equals()比较的是对象的内存地址&#xff0c;hashCode()比较的其实也是内存地址(内存地址输入到哈希函数中得到的整数) 重写了之后&#xff0c;equals()比较的是对象的内容值&#xff0c;如果hashCode()不重写&#xff0c;还是…

log是什么文件可以删除吗?log文件被删怎么恢复?

在工作和生活中&#xff0c;我们难免会遇到因操作失误、软件崩溃或病毒攻击等原因导致重要文件被误删的情况&#xff0c;这其中包括log文件。如果您不幸遇到log文件被误删的情况&#xff0c;不要过于担心&#xff0c;本文将为您介绍几种方法&#xff0c;帮助您找回被误删除的lo…

【hello Linux】动静态库

目录 1. 了解动静态库 1. ldd 命令的使用 2. C语言库与C语言库 3. 库的分类 4. 库的命名 5. 库的内容 2. 静态库的制作和使用 1. 静态库的制作 2. 静态库的使用 3.动态库的制作和使用 1. 动态库的制作 2. 动态库的使用 Linux&#x1f337; 1. 了解动静态库 1. ldd 命令的使用 …

JavaScript 鼠标事件监听触发时机触发顺序

有时间整理下鼠标的监听事件&#xff0c;目前汇总到的鼠标监听事件以下10个&#xff1a; 目录 1. click 2. dblclick 3.contextmenu 4.mousedown 5.mouseup 6.mouseenter 7.mouseleave 8.mouseover 9.mouseout 10.mousemove 先说下触发时机和作用键&#xff08;左键…

九州云出席全球分布式云大会,基于5G MEC的车路协同创新引关注

4月20日&#xff0c;以“云智相生”为主题的2023全球分布式云大会北京站在北京成功召开。本次大会作为AIGC数智中国科技周的重要组成部分&#xff0c;聚焦分布式云和人工智能&#xff0c;探讨分布式云如何更好地支持人工智能发展&#xff0c;打造MaaS&#xff08;模型即服务&am…

2023年4月中旬值得关注的几个AI模型:Dollly2、MiniGPT-4、LLaVA、DINOv2

AI模型的发展速度令人惊讶&#xff0c;几乎每天都会有新的模型发布。而2023年4月中旬也有很多新的模型发布&#xff0c;我们挑出几个重点给大家介绍一下。 Dolly-v2 MiniGPT-4 LLaVA DINOv2 Dolly-v2 Dolly是EleutherAI开源的一系列大语言模型&#xff0c;EleutherAI认为…

vue的diff算法原理

diff 概念diff比较流程头头尾尾头尾尾头比对查找过程 与vue3的区别 diff 概念 vue基于虚拟DOM做更新&#xff0c;diff的核心就是比较两个虚拟节点的差异。 vue的diff算法是平级比较&#xff0c;不考虑跨级比较的情况。内部采用深度递归 双指针的方式进行比较 diff比较流程 先…

文本挖掘 实践笔记

文本挖掘流程:(How) 文本预处理->特征提取->文本分析->可视化展示 文本预处理:包括文本清洗、分词、词性标注等 特征提取&#xff1a;将文本转化为词频、TF-IDF、embedding向量等 文本分析:利用统计学或机器学习的知识,做聚类、情感识别等 可视化展示:帮助人们更好…