人工智能时代大模型算法之文心大模型4.0

news2025/1/18 7:27:10

  大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳,不仅形成深入且独到的理解,而且能够帮助新手快速入门。

  今天给大家带来的是国产精品:人工智能时代大模型算法之文心大模型4.0,希望能对学习大语言模型的同学们有所帮助。

文章目录

  • 1. 百度世界大会
  • 2. 最强文心大模型4.0发布 综合能力比GPT-4毫不逊色
  • 3. 十余款AI原生应用以全新面目亮相
  • 4. 大模型深入产业、生态与生活
  • 5. 文心大模型4.0
  • 6. 文心一言助力国图馆藏文化资源活化,升级国家跳水队AI辅助训练系统
  • 7. 百度人才培养星河计划发布,再培养500万大模型人才

1. 百度世界大会

  “大模型带来的智能涌现,这是我们开发AI原生应用的基础。”10月17日,李彦宏在百度世界2023上表示。当天,李彦宏以《手把手教你做AI原生应用》为主题发表演讲,发布文心大模型4.0版本,并带来新搜索、新地图等十余款AI原生应用。

  大会举办了一场重磅主论坛和7场AI科技分论坛,涉及AI原生应用、大模型产业应用等多个主题。除李彦宏外,百度首席技术官王海峰,百度集团执行副总裁、百度智能云事业群总裁沈抖,百度集团资深副总裁、百度移动生态事业群组总经理何俊杰,百度集团副总裁、小度科技CEO李莹等高管现身分享。

在这里插入图片描述

  现场,李彦宏宣布文心大模型4.0正式发布,开启邀请测试。他表示,这是迄今为止最强大的文心大模型,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着显著提升,综合能力“与GPT-4相比毫不逊色”。

  李彦宏介绍,文心4.0也同步开始邀测,现场观众扫描嘉宾证二维码,登录文心一言官网或下载最新版文心一言APP就可以体验;此外,企业客户可以通过登陆百度智能云官网,在千帆大模型平台上申请测试文心4.0 API。
在这里插入图片描述
  本届百度世界大会是近4年来首次回归线下举办。当天,上千位企业家、创业者、高校专家、投资人、开发者等,齐聚北京首钢园,与百度共同见证AI原生时代的到来。

2. 最强文心大模型4.0发布 综合能力比GPT-4毫不逊色

  在李彦宏看来,AI原生应用的诞生,得益于大模型的理解、生成、逻辑和记忆四大核心能力,百度的AI原生应用也是基于文心一言来开发的,“这些能力是过去的时代所不具备的,因而才能打开无限的创新空间”。
在这里插入图片描述
  同时,他还通过解数学题、总结知识点等场景,展示了大模型的逻辑能力;通过数千字的小说撰写和角色、情节设置,体现了大模型的记忆能力;以及数字人医生帮助患者解读药品说明书,来展现四大能力的综合应用。

  “前面的演示,体现出文心大模型在理解、生成、逻辑、记忆这四大能力上的进步,这些能力是一切AI原生应用赖以生存的基础。”李彦宏表示。

3. 十余款AI原生应用以全新面目亮相

  丰富的AI原生应用才是大模型的价值所在。大会上,李彦宏宣布百度AI原生应用以全新面目亮相。据他介绍,百度新搜索具有极致满足、推荐激发和多轮交互三个特点。以极致满足为例,当用户搜索问题时,新搜索通过对内容的理解,生成文字、图片、动态图表的多模态答案,让用户一步获取答案。
在这里插入图片描述
  同时,李彦宏还展示了用AI原生思维打造的国内第一个生成式商业智能产品:百度GBI。它可以通过自然语言交互,执行数据查询与分析任务,还支持专业知识注入,满足更复杂、专业的分析需求。

  通过对海量文档、图片和视频的理解和再生成,百度网盘和文库拥有了创作能力;百度地图和智能办公平台如流,也通过理解、记忆等能力,变成更贴心的出行助手和超级助理。

  李彦宏强调,插件是一种特殊的AI原生应用,门槛最低,也最容易上手,能让开发者、创业者快速加入到生态中。

  据介绍,个人及企业的数据、能力或应用,都能快速变成AI插件,增强大模型的能力,让大模型更实用易用。李彦宏表示,一个月前,百度上线了灵境插件平台,目前已经有2.7万开发者申请入驻,覆盖法律、职场、学习等多个领域。

  在开发AI原生应用时,大模型的基础能力至关重要。李彦宏介绍说,API是AI原生应用调用基础大模型的主要方式,企业和开发者可以在百度的千帆大模型平台上调取包括文心一言在内的大模型API,目前,千帆大模型平台已经成为中国最大的大模型开发平台,有42个主流大模型入驻,覆盖各行各业近500个场景。即日起,企业客户也可以登录百度智能云官网 ,在千帆大模型平台上申请测试文心4.0的API。

  “大量AI原生应用将不断涌现,数字技术与实体经济将深度融合……大模型正成为新型工业化的重要推动力。”李彦宏说。

4. 大模型深入产业、生态与生活

  相比3.5版本,文心大模型4.0的四大能力有显著提升。这么显著的效果提升是怎么达成的?

  百度世界2023现场,王海峰针对文心大模型4.0背后的关键技术和最新进展进行了解读。他透露,理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。8月31日文心一言面向全社会开放至今,用户规模已经达到4500万,开发者5.4万,场景4300个,应用825个,插件超过500个。

在这里插入图片描述
  沈抖在现场宣布全面升级“云智一体”战略,将其战略内涵全面升级为“云智一体,深入产业,生态繁荣,AI普惠”。此外,面向企业落地大模型的五类需求:高效稳定的AI算力、大模型API调用、大模型二次开发、敏捷开发AI原生应用、便捷选购优质AI原生应用,百度智能云基于千帆大模型平台打造的“大模型超级工厂”分别给出了最佳服务方案。
在这里插入图片描述

  百度移动生态链接着10亿级用户和数百万生态伙伴,是百度应用层重构的重要战场。现场,何俊杰表示,将基于百度的技术“黑土地”,以AI原生应用“造林”,并与用户、客户、伙伴一起共育大模型的“生态雨林”。他重点展示了新文库、文心一言APP、百度电商慧播星等AI原生应用;在内容生态层面,通过百度APP“AI编辑器”等一系列应用为创作者生态赋能;在商业生态层面,通过AI Native商业产品“轻舸”等,助力企业效益提升。此外,何俊杰还公布了AI插件生态——“灵境矩阵”的最新成果,并面向全平台开发者、创业者发出邀请,共建大模型生态。

在这里插入图片描述
  作为百度“AI生活”布局的重要板块,小度全面拥抱文心一言大模型。李莹介绍,小度即将发布多款AI原生“新物种”:小度添添家庭机器人、小度青禾学习一体机以及全新智能音箱系列Tiantian Casa。她表示,小度始终坚持在人机交互技术领域不断创新,做“AI+智能设备”创新的代名词。让更多人感受到AI技术为生活带来的改变和无限可能,引领智能生活新未来。
在这里插入图片描述
  在信息世界之外,百度认为未来的大模型将走向多模态,进一步重构物理世界。自动驾驶就是大模型重构物理世界的一个案例。百度集团资深副总裁、智能驾驶事业群组总裁李震宇介绍,大模型让全无人自动驾驶真正落地。目前,百度自动驾驶出行服务平台萝卜快跑累计提供服务超过400万次,是全球最大的自动驾驶出行服务商。

  “大量AI原生应用将不断涌现,数字技术与实体经济将深度融合……大模型正成为新型工业化的重要推动力。”李彦宏说。正如百度世界2023的主题是“生成未来”,在演讲结尾,李彦宏宣布,我们即将进入一个AI原生的时代,进入一个人机通过Prompt来交互的时代。

在这里插入图片描述

5. 文心大模型4.0

  据了解,百度在3月16日发布知识增强大语言模型文心一言。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。

  文心一言的基础模型5月升级至文心大模型3.5,在基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等方面创新突破,取得效果和效率的提升。

  今天发布的文心大模型4.0,相比3.5版本,理解、生成、逻辑、记忆四大能力都有显著提升。其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。百度基于文心大模型研制了智能代码助手Comate,从内部应用效果来看,整体的代码采纳率达到40%,高频用户的代码采纳率达到60%。

在这里插入图片描述
  据悉,文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。训练算法效率自3月以来已累计提升3.6倍,周均的训练有效率超过98%。文心大模型4.0基本技术架构与3.0和3.5版本一脉相承,并在多个关键技术方向上进一步创新突破。

  在万卡算力上运行飞桨平台,通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持了大模型的稳定高效训练。建设了多维数据体系,形成了数据挖掘、分析、合成、标注、评估闭环,充分释放数据价值,大幅提升模型效果。基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证模型更好地与人类的判断和选择对齐。可再生训练技术通过增量式的参数调优,有效节省了训练资源和时间,加快了模型迭代速度。

  此外,文心大模型4.0在输入和输出阶段都进行知识点增强。一方面,对用户输入的问题进行理解,并拆解出回答问题所需的知识点,然后在搜索引擎、知识图谱、数据库中查找准确知识,最后把这些找到的知识组装进Prompt送入大模型,准确率好,效率也高;另一方面,对大模型的输出进行反思,从生成结果中拆解出知识点,然后再利用搜索引擎、知识图谱、数据库,以及大模型本身进行确认,进而对有差错的点进行修正。

  在强大的基础大模型的基础上,百度进一步研制了智能体机制,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并一定程度上将思考过程白盒化,让机器像人一样思考和行动,自主完成复杂任务,在环境中持续学习实现自主进化。

6. 文心一言助力国图馆藏文化资源活化,升级国家跳水队AI辅助训练系统

  百度已经与中国国家图书馆展开战略合作,发挥各自的资源、技术和服务优势,共同推动文化资源和知识服务智能化,普惠大众。国家图书馆拥有全球最大的古代方志,利用文心大模型学习古代方志与家谱数据,帮助全球华人获取更多寻根线索。王海峰现场分享了海外华人赵佩娟延续祖父乡愁,成功“寻根”的故事。

  中国国家跳水队教练、奥运五金王陈若琳和奥运冠军全红婵、陈芋汐、王宗源也来到世界大会现场,与王海峰热切互动,解密梦之队训练“独门绝技”。基于文心一言等百度大模型技术,中国国家跳水队AI辅助训练系统全面升级,通过从海量数据和知识中学习,掌握了丰富的跳水知识,理解和执行教练员和运动员的复杂指令,及时提供准确信息,并对动作实时打分、精准量化分析,提供最有价值的指导信息,助力中国国家跳水队高效训练。

在这里插入图片描述
  现场,陈若琳受中国游泳协会主席周继红委托,授予百度为“中国国家跳水队人工智能合作伙伴”。陈若琳表示,中国国家跳水队与百度从2019年就开展了深入的技术合作,携手走过了东京奥运会、福冈世锦赛、杭州亚运会,目前正在备战明年巴黎奥运会。“感谢百度一直以来提供的技术支持与服务,未来双方将携手持续用人工智能技术帮助跳水队智能训练,通过科学训练提升竞技水平。”

7. 百度人才培养星河计划发布,再培养500万大模型人才

  王海峰现场公布了百度人工智能人才培养的最新数据,百度在2020年提出5年为全社会培养500万AI人才,截至目前,百度已经培养了420万AI人才。

在这里插入图片描述
  当下,大模型成为人工智能发展的热点方向,进一步加速产业变革,AI人才培养也需与时俱进。王海峰发布了百度人才培养星河计划,他表示,“我们将与产学研各界密切合作,深化产教融合,为社会再培养500万大模型人才,让人工智能科技的‘创新之花’,结出更多‘产业之果’,服务国家战略,服务社会发展,服务人民福祉!”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1104174.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VsCode通过Git History插件查看某个页面的版本修改记录

首先需要安装插件Git History 方式一:通过 点击File History 查看某个文件变更;即通过commit的提交记录去查看某个文件的修改 方式二:通过点击选择toggle File Blame 查看当前页面每一行所有提交修改记录

吃鸡达人必备:分享顶级干货+作图工具推荐+账号安全查询!

吃鸡达人们,你们好!今天我来给大家介绍一些炙手可热的吃鸡话题,以及一些让你实力飙升的独家干货! 首先,让我们说一下如何提高自己的游戏战斗力。作为一名专业吃鸡行家,我将与你们分享一些顶级游戏作战干货&…

Python数据分析实战-dataframe分组提取每一组的首条记录(附源码和实现效果)

实现功能 使用pandas库来进行DataFrame的分组和提取每一组的第一条记录 实现代码 import pandas as pd# 创建一个示例DataFrame data {Group: [A, A, B, B, C],Value: [1, 2, 3, 4, 5]} df pd.DataFrame(data)# 按照 Group 列进行分组,并提取每一组的第一条记录…

C语言标准库函数使用的参考方式

联网后,登录https://cplusplus.com/ 以string.h库中的函数为例 点击后直接跳转,可点击右下角的按钮,显示实际运行输出

c刷题[6]

目录 杨辉三角 杨氏矩阵 字符串左旋 判断字符串 公务员面试 改数字 数字三角形 输出不重复序列 杨辉三角 在屏幕上打印杨辉三角。 先转化成二维数组: 1 1 1 1 2 1 1 3 3 1 规律:每行第一个元素和最后一个元素为1(主对角),从第三行开始&#xff…

【算法挨揍日记】day15——560. 和为 K 的子数组、974. 和可被 K 整除的子数组

560. 和为 K 的子数组 560. 和为 K 的子数组 题目描述: 给你一个整数数组 nums 和一个整数 k ,请你统计并返回 该数组中和为 k 的连续子数组的个数 。 子数组是数组中元素的连续非空序列。 解题思路: 我们可以很容易想到暴力解法&#xf…

C++对象模型(11)-- 虚基类

1、虚基类的引入 我们再来复习一下“多重继承的对象布局”,假设继承的类结构是这样的: 相应的代码: class W { public:int i_w; }; class X : public W {}; class Y : public W {}; class Z : public X, public Y {}; 我们在main()函数中加…

BUUCTF题解之[极客大挑战 2019]EasySQL 1

1.题目分析 考查sql注入的基本使用。 1.sql注入的定义 SQL注入是一种针对Web应用程序的攻击技术,通过在应用程序的用户输入参数中嵌入SQL代码,进而攻击应用程序的数据库。 攻击者可以通过SQL注入来获取敏感信息、执行无权执行的操作、甚至完全控制数据…

tomcat的部署以及优化

tomcat的介绍 Tomcat的简介 Tomcat 是 Java 语言开发的,Tomcat 服务器是一个免费的开放源代码的 Web 应用服务器,是 Apache 软件基金会的 Jakarta 项目中的一个核心项目,由 Apache、Sun 和其他一些公司及个人共同开发而成。 Tomcat 属于轻量…

Go项目踩坑:go get下载超时,goFrame框架下的go项目里将vue项目的dist同步打包发布,go项目打包并压缩

Go项目踩坑:go get下载超时,goFrame框架下的go项目里将vue项目的dist同步打包发布,go项目打包并压缩 go get下载超时goFrame打包静态资源vue项目打包gf pack生成go文件 静态资源使用打包发布go项目交叉编译,省略一些不必要的信息通…

黑客利用人工智能窃取医疗数据的 7 种方式

人工智能被描述为医疗保健行业的一把双刃剑。基于人工智能的系统可以分析大量数据并在早期和可治疗的阶段检测疾病,它们可以比任何人类更快地诊断症状,并且人工智能正在帮助药物开发,使新的救命药物得以识别并将其推向市场速度更快且成本显着…

三集合容斥原理整理

三集合容斥原理的三个公式都是怎么被推导出来的? - 刘明哲的回答 - 知乎 https://www.zhihu.com/question/465008307/answer/2251909478 你必须知道的行测数量知识(七)容斥问题 - 跟我考公吧的文章 - 知乎 https://zhuanlan.zhihu.com/p/4271…

基于若依框架的药品管理系统

若依框架每张表共有的五个属性: 更改若依后端代码时创建新的module,选择maven,继承ruoyi。 创建实体类时继承BaseEntity,这个类有创建人,创建时间等五个字段,这个类在其它模块中,需要在depende…

在.Core中用EF添加数据库实体类

首先安装dotnet-ef工具,否则提示: *无法执行,因为找不到指定的命令或文件。 可能的原因包括: *你拼错了内置的 dotnet 命令。 *你打算执行 .NET Core 程序,但 dotnet-ef 不存在。 你打算运行全局工具,但在路径上找不到…

SNAP对Sentinel-1预处理

SNAP对Sentinel-1预处理 一、导入数据 二、轨道校正 点击run开始处理 三、噪声去除 打开S-1 Thermal Noise Removal工具 如果选中了VH,就只会输出一个VH极化结果 四、辐射定标 Run 五、滤波处理 六、地形校正 这边的dem需要自己下载 dem下载地址 如果一格…

Orleans的成员管理和故障检测故障检测

Orleans的成员管理和故障检测故障检测 简介 Orleans框架是一个基于.NET平台的开源分布式系统框架,用于开发可扩展,高可用,高性能的云服务应用程序。它采用了Actor模型,将分布式系统中的各个节点抽象成为Actor,使得开…

Linux入门---页表的理解

目录标题 第一次认识页表第二次认识页表如何看待页表页表的大致构成 第一次认识页表 我们第一次认识页表是在介绍地址空间的时候,我们知道操作系统将内存划分为好几个区域,比如说栈区,堆区,未初始化区,已初始化区&…

力扣刷题 day47:10-17

1.位1的个数 编写一个函数,输入是一个无符号整数(以二进制串的形式),返回其二进制表达式中数字位数为 1 的个数(也被称为汉明重量)。 方法一:逐个判断 利用n&1 #方法一:逐个…

重载、重写(覆盖)与重定义(隐藏)

重载、重写(覆盖)与重定义(隐藏) 重载隐藏(重定义)多态:重写(覆盖) 三者的区别 重载 必须是在一个作用域,函数名相同,参数不同(个数不…

C复习-基础知识

参考: 里科《C和指针》Bryant, Hallaron 《深入理解计算机系统》何昊,叶向阳《程序员面试笔试宝典》 从hello.c到可执行文件hello 在Unix系统中,从源文件到目标文件的转化是由编译器驱动程序完成的: root> gcc -o hello hel…