我们习以为常的科技世界,正在以肉眼可见的速度被大模型所改变甚至重构。不想错失机遇的科技企业,都怀揣着造AI重器的梦想,各种大模型纷至沓来。
发布大模型只是开始,如同火箭发射,升空是第一步,后续能否顺利冲向太空、进入产业轨道,是一条充满了不确定的路。
有的企业耗费大量成本开发大模型,但实用效果不佳,发布之后就哑然无声、乏人问津,徒增了负担;有的大模型后续推动力不足,不能像OpenAI或百度一样,根据用户反馈持续推动大模型的迭代升级;有的则迷失了方向,找不到大模型进入产业的准确角度……
成功冲向天穹和产业轨道的大语言模型,文心一言,算是领衔的那个。
数据是最有力的佐证。5月16日,百度发布了截至2023年第一季度未经审计的财务报告,营收和利润双双超市场预期,其中营收311亿元,同比增长10%,净利润(non-GAAP)57亿元,同比大幅增长48%。
百度将这份稳健的业绩答卷,归功于生成式人工智能和大语言模型为各行各业带来的革命性潜力,以及百度及时布局大模型,文心一言开启内测,并计划逐步将文心一言融入百度的所有业务,围绕文心一言在新的时代中建立新生态,实现长期、可持续的增长。
借助文心一言这个“AI火箭”,百度业绩正冲向高处。
我们可以将文心一言的“动力装置”进行拆解,理解大模型的前进动力与产业价值。
飞桨+文心一言,全速前进
对于百度的业绩表现,有券商给出了这样的评价——百度是一个有多种催化剂的首选,如生成式人工智能、云和ADAS,可以推动多重扩张。
多重动力,这一特点也体现在百度大语言模型文心一言。
大模型要飞向产业轨道,光有前端的“航天器”是不够的,还需要算力、框架、生态等多重动力,提供足够的技术动能,来支撑整个旅程的不断加速。
就拿文心一言来说,发布之后行业伙伴普遍反馈效果好,一个主要原因是,能够根据用户反馈及时迭代强化模型能力、提高模型的推理效率、优化算力利用率,从而支撑大规模、高增长、高要求的产业需求。
而文心一言的全速前进,离不开与百度自研的产业级深度学习框架飞桨的联合优化。
文心一言+飞桨的协同,为大模型注入了多重动力:
第一,不断提高的推理能力,性能提升近10倍。
大模型在通用任务上的表现,需要根据用户反馈,来及时强化和提高模型的推理能力。
文心一言及背后的大模型,以飞桨做支撑,结合一言的模型结构特色和量化技术,完成推理引擎优化版本储备,从发布开始,平均保持着一星期左右完成1次迭代的速率,已经完成了4次迭代,相对第一版大模型推理服务,单机QPS已累计提升近10倍。这也意味着,文心一言的模型推理成本大幅降低,可为10倍数量的用户提供服务,大模型有望更加普惠地“飞入寻常百姓家”,落地各行业。
简单来说,就是文心一言的学习速度更快,变得越来越聪明。
另外,大语言模型的用户猛增,算力成为不容忽视的瓶颈,也进一步推高了算力成本。砸钱买算力是一个需要长期高投入的“无底洞”,提高模型算力利用率或是“治本”之道。基于飞桨分布式并行策略优化和训练精度策略调整,百度模型算力利用率将大幅度提升。
飞桨支持AI模型从训练到推理的全流程落地,AI大模型+深度学习框架的协同,是文心一言得以一飞冲天、向产业轨道加速前进的关键推动力。
大模型的多级动力装置
1909年,罗伯特·戈达德读了《月球上的第一批人》等科幻小说,开始对火箭动力学进行了广泛的理论研究,并提出了多级火箭的蓝图。根据动量守恒定理,火箭进入太空轨道,需要多级推进器,在航程的每个阶段,持续供给燃料,才能突破地球引力圈。
大模型要突破技术落地的限制,走向产业轨道,也需要一个层层推进的多级动力装置。
百度全栈AI技术,就组成了这样一个 “多级动力装置”,在大模型时代,让文心一言呈现出差异化的能力:
一是成长快速。
前面提到,模型层的文心一言,和框架层的飞桨,联合优化、相互促进、相互成就,是大模型效率、效果提升的最根本原因。飞桨集深度学习核心框架、基础模型库、端到端开发套件、丰富的工具组件于一体,百度全栈自研产品,分布在百度人工智能四层架构,彼此适配度更高,可以高效协同,实现端到端优化,模型迭代开发的速度自然更快。
没有自研深度学习框架的大模型服务商,要么从头开始研发,要么基于TensorFlow和PyTorch等深度学习框架进行再开发,很难充分满足大模型的训练需求。
二是全面可靠。
大模型是当之无愧的“AI重器”,而围绕大模型展开的博弈,或许会在不远的将来,成为困扰大量行业用户的头疼问题。
每天与无数国人进行问答的大模型,建立在其他国家的深度学习框架上,危险系数可想而知。因此,大模型的自立自强、安全可靠,必须将核心技术掌握在中国企业受众。
文心系列大模型,建立在百度长期部署的AI基础设施与底层自研技术之上,能够消除千行百业应用大模型的后顾之忧,加速产业智能化转型升级。
三是可持续发展。
大模型作为一种新技术、新产品,发展模式还没有成熟的路径可以借鉴,需要长期投入、探索无人区、试错迭代,摸索的过程也意味着大量的创新投入,一不小心就会掉队,紧跟行业趋势,补全大模型所需要的基础设施和配套技术,又会带来巨大的研发工作量和成本压力。
百度人工智能四层框架“芯片层-框架层-模型层-应用层”,布局完整、技术领先、应用落地,为文心一言构筑了持续竞争力。
举个例子,大模型如何落地业务场景,在很多行业还是个未知数,而得益于百度AI生态的产业实践和积累,文心行业大模型已经在电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域,展开了应用落地。
IDC发布《2022中国大模型发展白皮书》显示,百度文心大模型处于行业第一梯队,产品能力、应用能力、生态能力全面领先。
正如OpenAI的突破不是一朝一夕完成的,文心一言的“一飞冲天”,靠的并不是单一技术的炸裂,而是没有短板的百度AI长期蓄力,最终让文心大模型突破限制、飞向天穹。
百度AI,跃向无限可能,
火箭航程的最后一阶段,是让太空船能安然步入与行星同步的轨道。大模型的终点,则是与产业接轨,百度已经走到了这一环节。
大模型的浪潮还将持续,如何将大模型嵌入到产业中去,与产业应用结合?恐怕会成为未来几年内国产大模型的重要话题,或者说挑战。
我们关注文心一言的意义,就在于此。
有券商报告显示,自ERNIE Bot宣布以来,企业客户对基于云的ERNIE Bot服务的需求强烈,其中许多是新的云客户。此外,ERNIE Bot推出以来获得了大量高质量销售线索,许多已经转化为探索AIGC应用的共同开发项目。
AI基础设施和SaaS化服务,对云服务的直接带动作用,在百度财报中也有较为清晰的体现。百度智能云2023年第一季度营收为42亿元,同比增长8%,且在本季度实现盈利。在竞争激烈的云市场中实现盈利,是很多云巨头面临的难题,百度智能云则凭借AI的核心优势,找到了自己的节奏。随着文心一言的持续发力,百度在云市场的表现也有了更多可能性。
这些实打实的产业成绩单,都是大模型与产业接轨、百度AI技术成功转化的证明。拆解百度AI的成功路径,对于大模型和产业的后续影响,其重要性可能远大于财报本身。
文心一言完成与产业轨道的“最后一米”对接,我们可以看到一条路径:首先是技术能力的自证与他证,接下来是平台化的动力供给与工具完备,才有了文心与百度业务和行业应用的结合与落地。
文心一言与飞桨协同进化,共同组成新型AI基础设施,这一思路也为后来的大模型创新,踏平了道路。
敢为天下先的百度AI,也在“飞桨+文心“动力引擎的轰鸣声中,驶出了我们期待的中国速度和中国力量,驶向产业智能化的无限未来。