近期,国内多款大模型重磅消息不断。
1
3月,月之暗面的Kimi升级迭代后,长文本能力达到尚未上线的GPT-4.5Turbo的10倍。
2
4月,商汤科技发布的“日日新SenseNova”5.0多模态大模型在主流客观评测上,中文理解、知识储备、数理逻辑、代码编程等方面的能力就达到了GPT-4Turbo。
3
5月9日,阿里云发布通义千问2.5,据称“在中文场景模型性能赶超GPT-4-Turbo”,同时1100亿参数开源模型在多个基准测评收获最佳成绩。
4
5月15日,字节跳动正式发布“豆包大模型”,这也是国内又一家互联网巨头发布的自研大语言模型。据介绍,豆包大模型目前日均处理1200亿Tokens(表示和传递信息的标识符)文本,生成3000万张图片。
此外,从各项指标测评来看,国内部分自研大模型亦表现亮眼。近期,全球增长咨询公司沙利文发布的《2024年中国大模型能力评测》对国内主流的15个大模型进行了横评,其中,百度、腾讯、阿里等互联网大厂旗下大模型位于第一梯队,综合表现更为优异。而百度文心一言能力最为全面,五项评测维度均为优势能力,并取得四项第一。
上述种种,说明国内领先的大模型企业已取得了显著的进步,成功缩小了与国外先进水平的差距。
这让我们有理由相信在“百模大战”的下半场,会如近期腾讯研究院发布的《向AI而行,共筑新质生产力——行业大模型调研报告》中所说那样,在“人工智能+”政策指引下,随着国产大模型能力的提升,行业大模型将加速落地,向多模态、AIAgent等方向发展。这就像是AI界的“未来城市”,充满了无限可能。
01
AI大模型的中国竞速
如今,国产AI大模型已狂飙突进有一年时间。
2023年,在ChatGPT爆火之后,大模型技术迅速在全球科技界掀起了一场风暴,引发科技巨头们的激烈角逐。国内的科技大厂、中小企业、科研院所亦纷纷入局,当百度“文心一言”打响“大模型的第一枪”后,阿里巴巴“通义千问”、华为“盘古”、360“智脑”、昆仑万维“天工”、京东“灵犀”、科大讯飞“星火”、腾讯“混元”、商汤“日日新”等一大批大模型陆续登场,拉开了国产大模型进击的序幕。
据了解,目前市场上的AI大模型按照部署方式进行划分,主要分为云侧大模型和端侧大模型。与云侧大模型主要面向产业化应用需求不同,端侧大模型主要服务于个人用户。
毫无疑问,在这场空前的科技浪潮中,随着多家科技厂商推出AI大模型并落地商用,各类通用、行业以及端侧大模型在多个领域取得了显著的成果,初步形成多元化的产业生态。
在通用AI大模型方面,极具代表性的大模型产品如百度“文心一言”、阿里巴巴“通义千问”等具有强大的自然语言处理能力,可以应用于多个领域,包括但不限于智能客服、智能写作、知识问答等。
在行业AI大模型方面,蜜度的文修大模型、容联云的赤兔大模型、用友的YonGPT大模型等都是各自领域的佼佼者。这些大模型针对特定行业的需求进行了优化和定制,能够提供更加精准、专业的服务。例如,YonGPT大模型深耕企业服务领域,通过智能化业务运营、自然化人机交互、智慧化知识生成和语义化应用生成四大方向,为企业提供全价值链、全场景的泛在智能应用。
在端云结合的AI大模型方面,vivo的蓝心大模型是其中的代表。蓝心大模型是首个在手机端运行的开源大模型系列,通过矩阵化部署适应不同应用场景,为手机用户提供智能化服务,如智能创作、知识问答、角色扮演等功能。这种端云结合的方式使得AI大模型的应用更加广泛和便捷。
在端侧AI大模型方面,蔚来的NOMIGPT大模型是一个典型的例子。NOMIGPT大模型是蔚来汽车推出的智能语音助手,具有强大的自然语言处理能力和多模态交互能力,能够为用户提供更加智能、便捷的驾驶体验。
尤其进入2024年以来,又有多重利好因素推动着国内大模型产业快速发展。首先是“人工智能+”行动等来自政府层面的有力支持,其次用户提升生活、工作效率的需求激增,再就是科技公司加大对AI领域投入资金、人力、技术研发。据国家网信办今年4月发布的公告显示,目前我国已有117个大模型完成生成式人工智能服务备案。
对此,有相关机构指出,这一势头表明国产AI大模型不仅在技术层面取得了突破,更在商业应用和推动社会生产力变革方面展现出巨大潜力,但同时也要看到,真正的爆款应用尚未出现,国产大模型要真正走到规模化部署依然道阻且长。
02
深耕行业、落地行业的
企业级大模型或成最优解
一项全新的技术要切实在生产生活中发挥作用,应用的场景尤为关键。
如果说2023年是AI大模型市场的百“模”争鸣,那么2024年则将成为国产大模型全面商业落地的元年,进入赋能千行百业的关键期。因此,如何将大模型与产业化应用无缝连接,并把大模型以高效低成本方式落地到千行百业,就成为大模型企业亟待突破的方向和自证价值的考场。
有业内人士指出,目前来看,现在问世的更多是通用大模型,这类大模型具备强大的自然语言理解、语言生成和语音识别等能力,在聊天、娱乐等通识属性较强的场景上表现颇佳,但这些场景目前还难以实现大规模商业化。而在细分的产业场景上,通用大模型回答准确度较低,这是因为产业本身数据样本量较少、数据分布不均、应用场景多变,导致大模型无法进行自我优化和改进,输出精度自然不高。因此,从商业化落地来看,企业或许并不需要一个“全能”的通用大模型,而是更需要针对细分领域场景、解决实际问题的产业大模型。
中国工程院院士邬贺铨表示,“我们需要去深入思考大模型的应用方向,要将大模型切实投入到城市发展、金融科技、生物医药、工业制造、科学研究等领域,也需要专业的企业和组织加速其在实体产业落地,为产业刚需带来实实在在的价值,真正意义大规模服务社会。”
百度创始人李彦宏亦深刻指出:“单纯地追求大模型的规模与复杂度,并无实质性的意义。真正有价值的,是将这些技术应用于实际场景中,发掘出更大的商业机会。”
腾讯高管汤道生则表达了类似的观点:“大模型只是我们探索AI世界的起点,真正的未来在于它如何与各行各业深度融合,实现技术的落地应用。”
通过多位专家的见解,可见大模型落地终究还是要回归产业、回归真实场景、解决实际问题,才是技术的最终归宿,也是大模型良性发展的开端。
而有相关机构也指出,我国AI大模型的发展正处于多元并行的技术突破阶段,在这一过程中,对趋势的把握将成为众多参与者破局的关键。由此看来,在国际人工智能竞争愈发激烈的当下,对于已入局的众厂商而言,除抛开基础层面的较量外,能率先在赛道里抢到更多筹码的应该是在各行各业的切实落地上。
03
多维着力培育大模型发展沃土
2024年1月30日,科大讯飞举行星火认知大模型V3.5升级发布会——全国产化算力平台“飞星一号”、讯飞星火V3.5、语音大模型、星火开源-13B等产品接连亮相的同时,科大讯飞亦端出了诸多大模型商业化成果。
日前,阿里云接连发布多个关于行业大模型落地的消息。例如,与中国科学院国家天文台人工智能工作组共同打造了新一代天文大模型——“星语3.0”、中国一汽基于阿里云通义千问打造了汽车行业的首个大模型BI应用、基于阿里云通义大模型打造的国内首个民航机场大模型应用正式上线、西安塔力科技通过接入阿里云通义大模型实现了大模型在矿山场景中的首次规模化应用等。从阿里云的实际动向不难看出,其正加快行业落地的步伐,同时,也体现出阿里云“通义千问伙伴计划”正在持续输出实际效益。
可以说,2024年以来,一系列大模型落地案例让我们看到了“AI+”的广阔想象空间,也了解了大模型的真实提效价值,但根据业界多位专家的公开发言可知,除了目前大模型自身仍然存在的缺陷外,随着竞争的逐渐激烈,我国大模型产业化在相关数据、算力、算法等方面的困境也逐渐暴露,同时在安全可控、隐私保护、伦理偏见等方面也面临挑战。
360创始人周鸿祎曾在接受相关媒体采访时表示,虽然公开的大模型是通用的,甚至是万能的,但是当深入到具体行业时仍然面临着缺乏行业深度、不懂企业内部知识、易导致企业内部数据泄露、无法控制成本等问题。
与此同时,中国工程院院士、紫金山实验室主任刘韵洁表示,“近期,大模型在全球范围内不断涌现,但我国的通用大模型已经落后于美国。其中一大主要原因就是数据,美国有全球数据资源方面的优势。我国的机会,是行业大模型,因为与实体经济紧密相关,但前提是要把行业的大数据利用好、管理好、保护好。”
华为混合云副总裁胡玉海认为,大模型需要行业高质量的数据作为输入才能发挥价值,但现在很多企业的业务建设比较分散,数据的共享和汇聚挑战很大。业务的分散,也使得大模型生成后落地效果受限。同时,大模型算法的调优依赖于人才的能力和经验,我们目前的人才相对来说比较匮乏,这可能使得大模型产生价值的周期变长,使得大模型落地的门槛变高。
“我国人工智能大模型走向实践,还需妥善解决算力资源配置、数据开发利用、人工智能立法等关键性问题,让这些‘根’技术足够坚韧。”在西南政法大学人工智能法学院院长陈亮看来。
如何充分用好现有大模型基础,发挥场景优势,形成通用人工智能的产业生态,各行业都还在积极探索之中。
在今年两会期间,各界代表委员们的提案从不同角度给出了意见参考。比如中国科学院计算技术研究所研究员张云泉建议集中AI芯片研制力量突破算力瓶颈。还有一些企业代表从发展生成式AI教育、建立AI数据交易市场等方面提出建议。作为大模型国家队的重要参与者,科大讯飞董事长刘庆峰从系统性出发,建议加快制定国家《通用人工智能发展规划》,建议围绕自主可控算力生态构建、高质量数据开放共享、科学的评测标准制定、源头技术前瞻研发、人才培养等维度打造优势。综合这些代表的建议,可以看到,无论是着眼人才、算力还是应用、系统规划,当下产业的一大当务之急,无疑是要打造国产大模型应用生态。
同时,行业主管部门也一直在思考。工信部指出,下一步大模型技术发展最主要的一个侧重点是在生产领域的应用。这将是国际竞争非常激烈的一个新赛道。我们要以人工智能和制造业深度融合为主线、智能制造为主攻方向、场景应用为牵引,统筹布局通用大模型和垂直领域专用模型,从供需两端发力,营造创新生态,高水平赋能新型工业化。要加大创新投入,夯实算力、算法、模型、数据等技术底座,提升大模型性能水平。
AI大模型作为人工智能领域的重要里程碑,正引领着行业迈向一个新的发展阶段。面对挑战与机遇并存的未来,持续的技术创新、合理的政策引导以及跨界的紧密合作将是推动这一领域健康发展的关键。
如何学习AI大模型?
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
四、AI大模型商业化落地方案
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。