“群模时代”,国产AI大模型的进击

news2024/9/21 20:40:18

近期,国内多款大模型重磅消息不断。

1

3月,月之暗面的Kimi升级迭代后,长文本能力达到尚未上线的GPT-4.5Turbo的10倍。

2

4月,商汤科技发布的“日日新SenseNova”5.0多模态大模型在主流客观评测上,中文理解、知识储备、数理逻辑、代码编程等方面的能力就达到了GPT-4Turbo。

3

5月9日,阿里云发布通义千问2.5,据称“在中文场景模型性能赶超GPT-4-Turbo”,同时1100亿参数开源模型在多个基准测评收获最佳成绩。

4

5月15日,字节跳动正式发布“豆包大模型”,这也是国内又一家互联网巨头发布的自研大语言模型。据介绍,豆包大模型目前日均处理1200亿Tokens(表示和传递信息的标识符)文本,生成3000万张图片。

此外,从各项指标测评来看,国内部分自研大模型亦表现亮眼。近期,全球增长咨询公司沙利文发布的《2024年中国大模型能力评测》对国内主流的15个大模型进行了横评,其中,百度、腾讯、阿里等互联网大厂旗下大模型位于第一梯队,综合表现更为优异。而百度文心一言能力最为全面,五项评测维度均为优势能力,并取得四项第一。

图片

上述种种,说明国内领先的大模型企业已取得了显著的进步,成功缩小了与国外先进水平的差距。

这让我们有理由相信在“百模大战”的下半场,会如近期腾讯研究院发布的《向AI而行,共筑新质生产力——行业大模型调研报告》中所说那样,在“人工智能+”政策指引下,随着国产大模型能力的提升,行业大模型将加速落地,向多模态、AIAgent等方向发展。这就像是AI界的“未来城市”,充满了无限可能。

01

AI大模型的中国竞速

如今,国产AI大模型已狂飙突进有一年时间。

2023年,在ChatGPT爆火之后,大模型技术迅速在全球科技界掀起了一场风暴,引发科技巨头们的激烈角逐。国内的科技大厂、中小企业、科研院所亦纷纷入局,当百度“文心一言”打响“大模型的第一枪”后,阿里巴巴“通义千问”、华为“盘古”、360“智脑”、昆仑万维“天工”、京东“灵犀”、科大讯飞“星火”、腾讯“混元”、商汤“日日新”等一大批大模型陆续登场,拉开了国产大模型进击的序幕。

图片

据了解,目前市场上的AI大模型按照部署方式进行划分,主要分为云侧大模型和端侧大模型。与云侧大模型主要面向产业化应用需求不同,端侧大模型主要服务于个人用户。

毫无疑问,在这场空前的科技浪潮中,随着多家科技厂商推出AI大模型并落地商用,各类通用、行业以及端侧大模型在多个领域取得了显著的成果,初步形成多元化的产业生态。

在通用AI大模型方面,极具代表性的大模型产品如百度“文心一言”、阿里巴巴“通义千问”等具有强大的自然语言处理能力,可以应用于多个领域,包括但不限于智能客服、智能写作、知识问答等。

图片

在行业AI大模型方面,蜜度的文修大模型、容联云的赤兔大模型、用友的YonGPT大模型等都是各自领域的佼佼者。这些大模型针对特定行业的需求进行了优化和定制,能够提供更加精准、专业的服务。例如,YonGPT大模型深耕企业服务领域,通过智能化业务运营、自然化人机交互、智慧化知识生成和语义化应用生成四大方向,为企业提供全价值链、全场景的泛在智能应用。

在端云结合的AI大模型方面,vivo的蓝心大模型是其中的代表。蓝心大模型是首个在手机端运行的开源大模型系列,通过矩阵化部署适应不同应用场景,为手机用户提供智能化服务,如智能创作、知识问答、角色扮演等功能。这种端云结合的方式使得AI大模型的应用更加广泛和便捷。

在端侧AI大模型方面,蔚来的NOMIGPT大模型是一个典型的例子。NOMIGPT大模型是蔚来汽车推出的智能语音助手,具有强大的自然语言处理能力和多模态交互能力,能够为用户提供更加智能、便捷的驾驶体验。

尤其进入2024年以来,又有多重利好因素推动着国内大模型产业快速发展。首先是“人工智能+”行动等来自政府层面的有力支持,其次用户提升生活、工作效率的需求激增,再就是科技公司加大对AI领域投入资金、人力、技术研发。据国家网信办今年4月发布的公告显示,目前我国已有117个大模型完成生成式人工智能服务备案。

对此,有相关机构指出,这一势头表明国产AI大模型不仅在技术层面取得了突破,更在商业应用和推动社会生产力变革方面展现出巨大潜力,但同时也要看到,真正的爆款应用尚未出现,国产大模型要真正走到规模化部署依然道阻且长。

02

深耕行业、落地行业的

企业级大模型或成最优解

一项全新的技术要切实在生产生活中发挥作用,应用的场景尤为关键。

如果说2023年是AI大模型市场的百“模”争鸣,那么2024年则将成为国产大模型全面商业落地的元年,进入赋能千行百业的关键期。因此,如何将大模型与产业化应用无缝连接,并把大模型以高效低成本方式落地到千行百业,就成为大模型企业亟待突破的方向和自证价值的考场。

图片

有业内人士指出,目前来看,现在问世的更多是通用大模型,这类大模型具备强大的自然语言理解、语言生成和语音识别等能力,在聊天、娱乐等通识属性较强的场景上表现颇佳,但这些场景目前还难以实现大规模商业化。而在细分的产业场景上,通用大模型回答准确度较低,这是因为产业本身数据样本量较少、数据分布不均、应用场景多变,导致大模型无法进行自我优化和改进,输出精度自然不高。因此,从商业化落地来看,企业或许并不需要一个“全能”的通用大模型,而是更需要针对细分领域场景、解决实际问题的产业大模型。

图片

中国工程院院士邬贺铨表示,“我们需要去深入思考大模型的应用方向,要将大模型切实投入到城市发展、金融科技、生物医药、工业制造、科学研究等领域,也需要专业的企业和组织加速其在实体产业落地,为产业刚需带来实实在在的价值,真正意义大规模服务社会。”

百度创始人李彦宏亦深刻指出:“单纯地追求大模型的规模与复杂度,并无实质性的意义。真正有价值的,是将这些技术应用于实际场景中,发掘出更大的商业机会。”

腾讯高管汤道生则表达了类似的观点:“大模型只是我们探索AI世界的起点,真正的未来在于它如何与各行各业深度融合,实现技术的落地应用。”

通过多位专家的见解,可见大模型落地终究还是要回归产业、回归真实场景、解决实际问题,才是技术的最终归宿,也是大模型良性发展的开端。

而有相关机构也指出,我国AI大模型的发展正处于多元并行的技术突破阶段,在这一过程中,对趋势的把握将成为众多参与者破局的关键。由此看来,在国际人工智能竞争愈发激烈的当下,对于已入局的众厂商而言,除抛开基础层面的较量外,能率先在赛道里抢到更多筹码的应该是在各行各业的切实落地上。

03

多维着力培育大模型发展沃土

图片

2024年1月30日,科大讯飞举行星火认知大模型V3.5升级发布会——全国产化算力平台“飞星一号”、讯飞星火V3.5、语音大模型、星火开源-13B等产品接连亮相的同时,科大讯飞亦端出了诸多大模型商业化成果。

日前,阿里云接连发布多个关于行业大模型落地的消息。例如,与中国科学院国家天文台人工智能工作组共同打造了新一代天文大模型——“星语3.0”、中国一汽基于阿里云通义千问打造了汽车行业的首个大模型BI应用、基于阿里云通义大模型打造的国内首个民航机场大模型应用正式上线、西安塔力科技通过接入阿里云通义大模型实现了大模型在矿山场景中的首次规模化应用等。从阿里云的实际动向不难看出,其正加快行业落地的步伐,同时,也体现出阿里云“通义千问伙伴计划”正在持续输出实际效益。

可以说,2024年以来,一系列大模型落地案例让我们看到了“AI+”的广阔想象空间,也了解了大模型的真实提效价值,但根据业界多位专家的公开发言可知,除了目前大模型自身仍然存在的缺陷外,随着竞争的逐渐激烈,我国大模型产业化在相关数据、算力、算法等方面的困境也逐渐暴露,同时在安全可控、隐私保护、伦理偏见等方面也面临挑战。

360创始人周鸿祎曾在接受相关媒体采访时表示,虽然公开的大模型是通用的,甚至是万能的,但是当深入到具体行业时仍然面临着缺乏行业深度、不懂企业内部知识、易导致企业内部数据泄露、无法控制成本等问题。

与此同时,中国工程院院士、紫金山实验室主任刘韵洁表示,“近期,大模型在全球范围内不断涌现,但我国的通用大模型已经落后于美国。其中一大主要原因就是数据,美国有全球数据资源方面的优势。我国的机会,是行业大模型,因为与实体经济紧密相关,但前提是要把行业的大数据利用好、管理好、保护好。”

华为混合云副总裁胡玉海认为,大模型需要行业高质量的数据作为输入才能发挥价值,但现在很多企业的业务建设比较分散,数据的共享和汇聚挑战很大。业务的分散,也使得大模型生成后落地效果受限。同时,大模型算法的调优依赖于人才的能力和经验,我们目前的人才相对来说比较匮乏,这可能使得大模型产生价值的周期变长,使得大模型落地的门槛变高。

图片

“我国人工智能大模型走向实践,还需妥善解决算力资源配置、数据开发利用、人工智能立法等关键性问题,让这些‘根’技术足够坚韧。”在西南政法大学人工智能法学院院长陈亮看来。

如何充分用好现有大模型基础,发挥场景优势,形成通用人工智能的产业生态,各行业都还在积极探索之中。

图片

在今年两会期间,各界代表委员们的提案从不同角度给出了意见参考。比如中国科学院计算技术研究所研究员张云泉建议集中AI芯片研制力量突破算力瓶颈。还有一些企业代表从发展生成式AI教育、建立AI数据交易市场等方面提出建议。作为大模型国家队的重要参与者,科大讯飞董事长刘庆峰从系统性出发,建议加快制定国家《通用人工智能发展规划》,建议围绕自主可控算力生态构建、高质量数据开放共享、科学的评测标准制定、源头技术前瞻研发、人才培养等维度打造优势。综合这些代表的建议,可以看到,无论是着眼人才、算力还是应用、系统规划,当下产业的一大当务之急,无疑是要打造国产大模型应用生态。

同时,行业主管部门也一直在思考。工信部指出,下一步大模型技术发展最主要的一个侧重点是在生产领域的应用。这将是国际竞争非常激烈的一个新赛道。我们要以人工智能和制造业深度融合为主线、智能制造为主攻方向、场景应用为牵引,统筹布局通用大模型和垂直领域专用模型,从供需两端发力,营造创新生态,高水平赋能新型工业化。要加大创新投入,夯实算力、算法、模型、数据等技术底座,提升大模型性能水平。

AI大模型作为人工智能领域的重要里程碑,正引领着行业迈向一个新的发展阶段。面对挑战与机遇并存的未来,持续的技术创新、合理的政策引导以及跨界的紧密合作将是推动这一领域健康发展的关键。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1808336.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

arm开发板移植sshd

移植sshd 文章目录 移植sshd1、准备工作2、编译zlib3、编译openssl4、编译openssh5、其他旧版本6、部署测试7、多用户配置8、sshd_config示例 1、准备工作 准备openssh-9.5p1.tar.gz openssl-1.1.1w.tar.gz zlib-1.2.11.tar.gz 我在http://10.45.156.100/IG2100/IG2100.git …

栈的实现和括号匹配问题

1.什么是栈 栈:一种特殊的线性表,其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作的一端 称为栈顶,另一端称为栈底。栈中的数据元素遵守后进先出LIFO(Last In First Out)的原则。 压栈&#xf…

数据中心智能化运维发展研究报告(2023)解读

数据中心智能化运维发展研究报告(2023)解读 《数据中心智能化运维发展研究报告(2023)》探讨了数据中心智能化运维的概念、核心内容、实际应用和发展建议。报告指出,通过人工智能、大数据等新一代信息技术的深度应用&a…

【recast-navigation-js】使用three.js辅助绘制Agent寻路路径

目录 说在前面setAgentTarget绘制寻路路径结果问题其他 说在前面 操作系统:windows 11浏览器:edge版本 124.0.2478.97recast-navigation-js版本:0.29.0golang版本:1.21.5上一篇:【recast-navigation-js】使用three.js辅…

STM32CubeIDE使用过程记录

最近在做一款机器人的开发,使用到了STM32CubeIDE,这里记录一些使用技巧方便后续查阅。 STM32CubeIDE使用过程记录 快捷键开启代码自动补全功能看门狗设置CRC设置IO口取反定时器设置 及 定时器中断外部中断GPIO配置STC15单片机GPIO模式配置片内闪存&#…

PyTorch学习7:加载数据集

文章目录 前言一、epoch,batch-size和iteration二、示例1.说明2.代码示例 总结 前言 介绍PyTorch中加载数据集的相关操作。Dataset和DataLoader 一、epoch,batch-size和iteration epoch:所有训练数据完成一次前馈和反馈 batch-size&#x…

深度学习革命-AI发展详解

深度学习革命 《深度学习革命》是一部引人深思的作品,详细讲述了深度学习技术的发展历程及其对各个行业的深远影响。由杰出的计算机科学家、深度学习专家撰写,这本书不仅适合科技领域的专业人士阅读,也为普通读者提供了一个理解人工智能革命…

Vue TypeScript 实战:掌握静态类型编程

title: Vue TypeScript 实战:掌握静态类型编程 date: 2024/6/10 updated: 2024/6/10 excerpt: 这篇文章介绍了如何在TypeScript环境下为Vue.js应用搭建项目结构,包括初始化配置、创建Vue组件、实现状态管理利用Vuex、配置路由以及性能优化的方法&#x…

【电机控制】FOC算法验证步骤——电流环PI参数、速度环PI参数

【电机控制】FOC算法验证步骤——电流环PI参数、速度环PI参数 文章目录 前言一、电流环PI1.TI手册 二、速度环PI1.TI手册——根据稳定性和带宽计算速度环PI参数2.TI手册——根据稳定性和带宽计算速度环PI参数 三、参考文献总结 前言 【电机控制】直流有刷电机、无刷电机汇总—…

Python私教张大鹏 Vue3整合Vue Router之编程式导航

除了使用 <router-link> 创建 a 标签来定义导航链接&#xff0c;我们还可以借助 router 的实例方法&#xff0c;通过编写代码来实现。 导航到不同的位置 注意: 下面的示例中的 router 指代路由器实例。在组件内部&#xff0c;你可以使用 $router 属性访问路由&#xff…

vue-cli是什么?和 webpack是什么关系?

前言 Vue CLI是Vue.js项目的官方脚手架&#xff0c;基于Node.js与Webpack构建。安装Vue CLI前需确保Node.js已安装&#xff0c;随后通过npm全局安装。Vue CLI能迅速创建和管理Vue.js项目&#xff0c;提升开发效率。而Webpack则负责资源打包&#xff0c;通过配置文件管理依赖、插…

FiRa标准UWB MAC实现(三)——距离如何获得?

继续前期FiRa MAC相关介绍,将FiRa UWB MAC层相关细节进一步进行剖析,介绍了UWB技术中最重要的一个点,高精度的距离是怎么获得的,具体使用的测距方法都有哪些,原理又是什么。为后续FiRa UWB MAC的实现进行铺垫。 3、测距方法 3.1 SS-TWR SS-TWR为Single-Sided Two-Way Ra…

通过python操作redis(windows)

注意在连接之前要确保 redis 服务已经安装。 更多的安装信息请查看&#xff1a;https://blog.csdn.net/sinat_20471177/article/details/132042779?spm1001.2014.3001.5501 redis 模块 Python 要使用 redis&#xff0c;需要先安装 redis 模块。如果要做数据导入/导出操作的…

动手学深度学习4.10 实战Kaggle比赛:预测房价-笔记练习(PyTorch)

以下内容为结合李沐老师的课程和教材补充的学习笔记&#xff0c;以及对课后练习的一些思考&#xff0c;自留回顾&#xff0c;也供同学之人交流参考。 本节课程地址&#xff1a;实战 Kaggle 比赛&#xff1a;预测房价_哔哩哔哩_bilibili 本节教材地址&#xff1a;4.10. 实战Ka…

公式转换坑

在线LaTeX公式编辑器-编辑器 (latexlive.com) 这个好用 latex输入后转mathtype等 1 \mathcal{V}\{0,1,\ldots,|\mathcal{V}|-1\} 这个玩意在Word死活打不出来 使用下面的方法也不行 mathtype也不行 故换符号之 LaTeX公式与MathType公式如何快速转换-MathType中文网 如何在…

.Net实现SCrypt Hash加密

方案1 &#xff08;加密后存储“算法设置”、“盐(随机值)”、“Hash值”&#xff0c;以“$”分隔&#xff09;&#xff1a; //Nuget引入SCrypt.NET库 using Org.BouncyCastle.Crypto.Generators; using Scrypt; using System; using System.Security.Cryptography; namespace …

Python基础教程(九):装饰器

&#x1f49d;&#x1f49d;&#x1f49d;首先&#xff0c;欢迎各位来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里不仅可以有所收获&#xff0c;同时也能感受到一份轻松欢乐的氛围&#xff0c;祝你生活愉快&#xff01; &#x1f49d;&#x1f49…

强大的.NET的word模版引擎NVeloDocx

在Javer的世界里&#xff0c;存在了一些看起来还不错的模版引擎&#xff0c;比如poi-tl看起来就很不错&#xff0c;但是那是人家Javer们专属的&#xff0c;与我们.Neter关系不大。.NET的世界里Word模版引擎完全是一个空白。 很多人不得不采用使用Word XML结合其他的模版引擎来…

怎样快速获取Vmware VCP 证书,线上考试,voucher报名优惠

之前考一个VCP证书&#xff0c;要花大一万的费用&#xff0c;可贵了&#xff0c;考试费不贵&#xff0c;贵就贵在培训费&#xff0c;要拿到证书&#xff0c;必须交培训费&#xff0c;即使vmware你玩的很溜&#xff0c;不需要再培训了&#xff0c;但是一笔贵到肉疼的培训费你得拿…

嵌入式Linux系统编程 — 3.4 access、chmod和 umask函数修改文件访问权限

目录 1 文件访问权限 1.1 文件权限基本概念 1.2 普通权限 1.3 特殊权限 2 目录权限 3 access函数检查文件权限 3.1 access函数简介 3.2 示例程序 3.3 chmod修改文件权限 3.4 fchmod函数 4 umask 函数 4.1 umask简介 4.2 示例程序 1 文件访问权限 1.1 文件权限基本…