百度一系列产品又又又要上新了?敖丙我作为它的老用户,从内测到现在可以说是一直关注着,听说它有最新进展,我火速端起小板凳和瓜子去围观了下,这不新鲜热乎的实测就来了,好不好用咱拉出来遛遛。。
说起来“百模大战”已经持续了一年多,从最开始的卷参数,到最近的卷价格,可谓是如火如荼。
大模型训练自带“烧钱”属性,同时又极其考验工程积累,这两点很大程度上注定了大厂在这场游戏牌桌上更有机会,百度、阿里、字节都在持续发力,但工程积累是需要时间的,从训练、部署、推理到实践,这每一步都不是短时间内可以速成的。
今年的WAVE SUMMIT 深度学习开发者大会上,百度有三点让我眼前一亮,分别是文心大模型4.0 Turbo、飞桨框架3.0、文心快码。
国产最强Turbo版来了!
百度文心大模型上线了最新的 4.0 Turbo, 经过我的实际测试,可以明显感受到速度上快了不止一点,答案的可信度进一步加强。
目前,文心一言网页版、APP都已经开放了文心大模型4.0 Turbo,大家可以去体验一下。
同时文心大模型4.0 Turbo API 向开发者开放使用,丙子第一时间就进行了测试。
我用一模一样的问题分别对这三个模型进行测试,对应的API
以下相同答案三者的速度对比,在模型总响应时长变短了,平均每秒响应的字符数也得到了不少提升!
文心的联网搜索能力和超长文本能力,我在开放后也第一时间进行了体验
我让它写了一篇小说的开篇,可以看到对中文的处理能力绝对在顶尖水准,生成的内容质量很好,并且返回速度也非常快。
我还尝试了它的搜索功能,并让它将搜索结果转化成表格,可以看到它做的也非常好,省去了我到各个网页查询信息的工作量。
通过上面的测评结果不难发现,不仅结果质量更好了,而且速度还更快了,我一直对大模型领域十分关注,所以我很好奇他是怎么做到的?
原来是底层架构上,也有了升级。飞桨发布核心框架 3.0,专为大模型设计。
这其中技术的领先性占据重要作用,飞桨在这其中的各个环节,都花了很大的精力建设和优化。我从训练和推理两个方面来说一下,这部分可能技术术语稍微多些。
首先是训练阶段,大模型的混合并行训练是非常复杂的,涉及到混合并行、通信以及调度策略等多个方面。为了简化这项工作,百度研发了自动并行能力,让不同参数模型的训练性能均能够得到显著提升,提升幅度也达到了20%。
然后是推理阶段的性能优化,这个对于大模型的响应速度是更直接的影响。通过大会的介绍我得知,飞桨通过高性能分段矩阵与多流加速计算的手段,让 LoRA 获得了集约化的部署,从而让推理变得更快。数据上来看则体现的更为直观,相同精度下,LoRA 的推理性能可以提升 33.3%。量化后性能可以提升 113.3%。这就是你在页面看到的,每个字的吐出都变快了的最直接原因了。
这套国内首个大模型全链路生态支持体系,不单单支撑了文心一言。大会公布了这样一组数据:目前的飞桨文心生态,包括了1465 万开发者、37 万家企事业单位、 95 万个模型,已经名副其实的成为了一个生态系统。
文心快码到底有多快?
Baidu Comate不仅升级至2.5版本,还带来了中文名“文心快码”,对比之前有了知识增强、研发流程全域赋能、企业级安全等方面提升。作为一名程序员,这是实实在在能给我带来效率提升的,所以我更是格外关注。
我发现,在之前续写、解释代码、问答等能力的基础上,新版本可深度解读代码库、关联权威公域和私域知识生成新的代码,这样生成的代码更贴近真实场景,与实际业务贴合的更紧密;同时,并且可以智能检测安全漏洞、一键修复漏洞,支持混合云部署等,让生成的代码更安全了。
大家要知道文心快码现在在一些企业有将近40%的整体采纳率,这意味着他得代码采纳率在一定程度上超过了部分程序员。虽然作为程序员我有些慌张,担心被取代,但现在的确是用起来真香......
而我个人之所以这么积极的去拥抱AI编码工具,因为他确确实实给我带来了不小的效率提升,从最开始的重复性代码补全、单测生成、bug分析,到现在可以做到自然语言对话生成大部分我可以采纳的代码,脚本,这些提效都是实实在在发生着。
关于Comate更多具体效果的细节测评,大家感兴趣的也可以去看看我之前的介绍视频。
闲聊
再先进的技术,也只有在实际场景中落地,才能真正带来价值。
而拥抱这些场景,正是国内科技公司所擅长的事。
在 WAVE SUMMIT 上,我亲眼见证了大模型如何赋能各个行业,在实际应用中创造出前所未有的价值。
这不仅仅是技术的进步,更是时代的进步。看到人工智能真正为普通人解决问题,让我深受震撼。
相比于什么时候实现AGI,我更关心的是人工智能如何一点点改变我们的生活和工作,目前让我意识到的一点是,这个过程中,随着AI能力的持续解锁,我们的生活会逐渐发生巨大的变化,这一切已经就在眼前。