大模型时代的AI应用开发,可以不用,但必须会

news2025/1/25 4:30:20

成熟的“格子衫”和年轻的“脸庞”,与开发者有关的大会总是少不了这两种元素,Create 2024百度AI开发者大会也不例外。

过去几十年,层出不穷的编程语言、框架等新技术,把一代又一代年轻的脸庞,塑造为成熟的格子衫,软件应用开发的效率确实在提升,但却总是跟不上庞大而又繁杂的需求,似乎开发者将永远陷入在这样的循环。

直到大模型的出现。

“你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”百度创始人、董事长兼首席执行官李彦宏言之凿凿。

掷地有声。成熟的格子衫还在思考,话语有几分可信与其间难题,年轻的脸庞已经深信不疑,迫切想要听到该如何“说话”,才能成为新时代的开发者。

基础大模型的确炫人眼目,大部分人如今还沉浸在基础模型层面,但是时候把更多目光聚焦在应用层面,先是大模型等新技术为应用场景提供了新的可能性,接下来就是软件应用生态的繁荣,去推大模型的再次提升。

而百度正在做的事,就是扫平大模型和应用之间的障碍,这也是本次开发者大会,百度拿出的三大工具——智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。

大模型,应用为王

“大语言模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。”李彦宏表示。

正如李彦宏所言,过去一年,大模型足够让人侧目,例如百度文心大模型,从3.0版本到3.5,再到4.0版本的进化,在代码生成、代码解释、代码优化等通用能力方面,达到国际领先水平。

文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。

但仅靠大模型还不足以催生出新的业态,就像互联网起初只是一种技术概念,而互联网应用融入到千行百业的场景,造就了如今耳熟能详的互联网巨头。“他们”没有发明互联网技术,也没有在互联网的底层基础设施做文章,却是把互联网用得最好的代表。

百度为开发者提供的大模型,就像是过去的互联网,百度有动力也有必要,提供尽可能好的大模型,从而为大模型应用开发者打好基础。

可以想象,百度冲在大模型第一线,踩坑是免不了的。李彦宏也直言,百度“踩了无数的坑,交了高昂的学费”,得出了一些基于大模型开发AI原生应用的具体思路和工具,直接分享给行业。

第一是MoE。未来大型的AI原生应用基本都是MoE架构,这里所说的MoE不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,要针对应用的不同场景做匹配。

第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过SFT精调后的小模型,其使用效果可以媲美大模型。

“这就是我们发布Speed,Lite、Tiny三个轻量模型的原因。我们通过大模型,压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。”李彦宏说。

第三是智能体。智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。

智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,还可以让不同的智能体互动,相互协作,更高质量地完成任务。这些智能体能力,反思、规划、自我计划的能力,百度已经开发并向开发者全面开放。

AI应用开发三大“神器”

李彦宏表示,大模型和生成式AI,将彻底改变开发者群体。过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言。

与之相对应地,开发者的武器库也需要与时俱进,以适应新时代的软件开发体系,同时针对MoE、小模型、智能体这三大方向上,百度已经做好了“开箱即用”的工具。

AgentBuilder:最主流的大模型使用方式

首先是智能体开发工具AgentBuilder。智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。

以新加坡旅游局为例,打开文心智能体平台,创建页面有着零代码、低代码两种模式,新手可以直接选择“零代码模式”,用自然语言,几句话就能创建一个智能体,实现酒店查询、景点门票购买等服务能力,目前百度已经跟携程合作,提供了酒店、景点、票务等旅游服务工具。

新加坡之外,大连、沈阳等文旅类智能体也都在文心智能体平台上线,还有知识类、创作类、学习类、娱乐类等各式各样的智能体。

目前,已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。文心智能体平台还为开发者们提供了流量变现的通路。除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体的相关能力,为开发者解决流量分发的后顾之忧,获得实打实的收益。

有分发,就会有数据反馈;有数据反馈,飞轮转起来,智能体就能够自主迭代,越用越聪明。文心智能体平台还上线了智能体的数据分析和问答调优模块,不久后还将有更多的新能力上线。文心智能体平台将通过分发-诊断-收益的数据飞轮,驱动智能体形成质量更优、流量更好、收益更大的正循环。

除了新加坡之外,大连、沈阳等文旅类智能体也都在文心智能体平台上线,还有知识类、创作类、学习类、娱乐类等各式各样的智能体,这些都能在AgentBuilder做出来。

AppBuilder:自然语言三步就能开发一个应用

AppBuilder提前封装和预置了开发AI原生应用所需的各种组件和框架,可以大幅降低开发门槛,不写一行代码,最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。

以游乐场排队助手为例,打开AppBuilder的开发界面,第一步先给应用起名“游乐场排队助手”,第二步填写角色指令,包括调用代码解释器、算出在固定时间内的最佳组合、输出结果等;第三步再插入需要的工具组件。这样,在零代码的情况下,一个应用就生成了。

从去年开始,百度用AI重构了百度文库,使它成为用户“内容生产的起点”。如今,在AppBuilder的支持下,百度文库新推出的智能漫画和智能绘本,更是把场景延伸到了更加有趣的跨模态创作领域。

在AppBuilder上面,百度也提供了一定的跨模态能力,开发者只需要给一段文字,或者几句话,就可以快速创建绘画类的应用,像漫画、儿童绘本等。百度文库最新推出的漫画生成和绘本生成功能,就利用了AppBuilder上提供的这类组件。

从行业视角来看,百度AppBuilder具备两个明显优势:

一是功能强大。依托文心4.0对指令的理解和遵循能力,百度AppBuilder能保证冷启动状态下就能达到一个不错的水平,不会因为效果差,再花很长时间去调优,大大降低了开发门槛。

依托检索增强技术RAG,在知识问答等典型场景,问答准确率和友好回复程度都达到了95%以上,大幅超越其他同类产品。AppBuilder还提供丰富完整的组件工具,包括百度搜索等基于百度多年技术积累的AI能力组件、大模型能力组件,还有百度独家开放的业务组件等55个组件。

此外,一些主流场景的第三方API,比如航班查询、论文查询等,百度也有提供,最新支持了自定义组件,客户可以直接对接自己专有的任何工具和数据。这些丰富的组件,共同支撑起了AI原生应用的高效开发。

二是简单易用。使用AppBuilder,只需三步即可快速创建应用、一键分发。百度也支持开源的SDK,方便大家进行二次开发。

ModelBuilder:高效低价生产模型

ModelBuilder是更适合专业开发者使用的工具,它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT,从而能达到更好的效果。

为了方便专业开发者快速上手,ModelBuilder预置了最全面最丰富的大模型。包括了ERNIE3.5和ERNIE4.0旗舰版大模型,它适合通用的复杂场景,能力强大;

此外还有三个轻量级的大模型,Speed、Lite、Tiny;以及两个垂直场景的模型——ERNIE Character适合角色扮演,ERNIE Functions适合对话或问答场景中的外部工具使用和业务函数调用。当然也包括国内外第三方主流模型,总数量达到77个,ModelBuilder是国内拥有大模型数量最多的开发平台。

以小度添添AI机器人日程规划为例,背后调用了不同的模型。先是由小模型ERNIE Tiny执行了“模型路由”的工作——把晨跑中的天气问题,分配给了基于ERNIE Lite打造的精调模型,快速查询出了气温25度、天气晴朗这些信息;同时,又把更复杂的日程安排,分配给了性能最好的大模型——文心4.0,来计算一天各项事项安排。

ModelBuilder的关键是高效低价生产模型的能力。企业客户可以根据需要,兼顾效果、响应速度、推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,并且支持精调和Post-pretrain。

通过降维裁剪出来的模型,比直接拿开源调出来的模型,同等尺寸下,效果明显更好,同等效果下,成本明显更低。

AI应用繁荣,大模型才能再进化

大模型到了聚合生态力量的新阶段,无论是国内还是国外,头部厂商都在试图打造新的大模型生态,AI应用的繁荣不仅能够证明大模型的价值,也能够反过来推动大模型的再进化。

当AI应用大量被创造,越来越多的数据被生成和收集,模型有更多的机会学习到不同场景下的应用知识;规模化带来专用硬件的普及和性能提升,使得训练和运行大模型变得更加可行和高效;多样化的应用场景带来正向商业收益,商业成功将转化为AI应用和大模型的资源。

百度文心大模型正在走上这一条路,用大模型和AI应用的相互促进,实现大模型生态的正向商业循环。

李彦宏表示,文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。百度在芯片、框架、模型、应用这四层架构上有着全栈的布局,通过端到端优化,不断地把成本打下来,让更多人都可以高效、低价地用大模型来做AI应用,通过端到端优化能力,不断提高文心大模型和文心一言的效率。

“实战是大模型最好的训练场,庞大的调用量将给予文心大模型更多反馈,反向促进了文心大模型的能力提升,形成飞轮效应,进一步扩大文心大模型和国内同行的差距。”他说。

文心一言从去年3月16日首发,在一年零一个月的时间里,用户数突破了2亿,每天API的调用量也突破了2亿,服务客户数或者说企业达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。

百度一并发布了文心大模型4.0的工具版,用户可以在工具版上体验代码解释器功能,通过自然语言交互,就能实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供高效精准的支撑。

此外,创业者生态也是大模型的有生力量。去年5月份,百度启动了“文心杯”创业大赛,第一届“文心杯”创业大赛,收到了近1000支创业团队报名,百度为其中的15支优胜团队,提供了近亿元的投资支持,并且在技术、团队和资源上持续提供全方位扶持。

李彦宏在现场宣布,第二届“文心杯”创业大赛正式启动,本次将扩大项目筛选范围、设置分赛场,面向全球市场及高校学子,招募创业创新团队。

只要创业方向是AI原生应用,都可以在大赛官网报名参赛,同时百度也加大了对创业者的支持力度,提供更充足的投资资金、更丰富的业务资源,还首次设立了“特别大奖”,特别优秀的项目将有机会获得最高5000万人民币的现金和资源支持。

无论是成熟的“格子衫”,还是年轻的脸庞,都是中国大模型产业的一分子,百度通过AI应用开发三大“神器”,展示出了一幅通向大模型产业未来的道路。这条路,有百度,也有千千万万的开发者群体。

零基础如何学习大模型 AI

领取方式在文末

为什么要学习大模型?

学习大模型课程的重要性在于它能够极大地促进个人在人工智能领域的专业发展。大模型技术,如自然语言处理和图像识别,正在推动着人工智能的新发展阶段。通过学习大模型课程,可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术,从而提升自己在数据处理、分析和决策制定方面的能力。此外,大模型技术在多个行业中的应用日益增加,掌握这一技术将有助于提高就业竞争力,并为未来的创新创业提供坚实的基础。

大模型实际应用案例分享

①智能客服:某科技公司员工在学习了大模型课程后,成功开发了一套基于自然语言处理的大模型智能客服系统。该系统不仅提高了客户服务效率,还显著降低了人工成本。
②医疗影像分析:一位医学研究人员通过学习大模型课程,掌握了深度学习技术在医疗影像分析中的应用。他开发的算法能够准确识别肿瘤等病变,为医生提供了有力的诊断辅助。
③金融风险管理:一位金融分析师利用大模型课程中学到的知识,开发了一套信用评分模型。该模型帮助银行更准确地评估贷款申请者的信用风险,降低了不良贷款率。
④智能推荐系统:一位电商平台的工程师在学习大模型课程后,优化了平台的商品推荐算法。新算法提高了用户满意度和购买转化率,为公司带来了显著的增长。

这些案例表明,学习大模型课程不仅能够提升个人技能,还能为企业带来实际效益,推动行业创新发展。

学习资料领取

如果你对大模型感兴趣,可以看看我整合并且整理成了一份AI大模型资料包,需要的小伙伴文末免费领取哦,无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

部分资料展示

一、 AI大模型学习路线图

整个学习分为7个阶段
在这里插入图片描述

二、AI大模型实战案例

涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,皆可用。
在这里插入图片描述

三、视频和书籍PDF合集

从入门到进阶这里都有,跟着老师学习事半功倍。
在这里插入图片描述

在这里插入图片描述

如果二维码失效,可以点击下方链接,一样的哦
【CSDN大礼包】最新AI大模型资源包,这里全都有!无偿分享!!!

😝朋友们如果有需要的话,可以V扫描下方二维码联系领取~
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2069667.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网络安全威胁2024年中报告

近日,奇安信威胁情报中心发布《网络安全威胁2024年中报告》,内容涵盖高级持续性威胁(APT)、勒索软件、互联网黑产、漏洞利用等几方面。 APT攻击活动:2024 年上半年,APT 攻击主要集中在信息技术、政府、科研…

设计模式笔记07(java版)

文章目录 迭代器模式定义结构优缺点使用场景迭代器模式在JDK源码中的使用 访问者模式定义结构案例实现优缺点使用场景扩展1. 分派:2. 动态分派:3. 静态分派:4. 双分派: 备忘录模式概述定义结构“黑箱”备忘录模式优缺点使用场景 解…

递归神经网络 (RNN) 简介

文章目录 一、介绍二、什么是递归神经网络 (RNN)?三、展开递归神经网络四、训练递归神经网络五、RNN 的类型六、现实生活中的 RNN 用例七、RNN 的两个主要限制八、RNN的变体8.1 双向递归神经网络 (BRNN)8.2 长短期记忆…

色彩的含义和使用色彩象征的艺术

无论你走到哪里,你都能看到颜色:天空中的白云,绿色的植被逐渐上升,灰色的石头结构和红砖建筑,在你脚下磨砺着棕色的土壤。你不只是看到这些颜色......你感觉到它们。 一,颜色的含义从何而来? 熟…

华为OD算法题整理目录

目录 专栏导读华为OD机试算法题太多了,知识点繁杂,如何刷题更有效率呢? 一、逻辑分析二、数据结构1、线性表① 数组② 双指针 2、map与list3、队列4、链表5、栈6、滑动窗口7、二叉树8、并查集9、矩阵 三、算法1、基础算法① 贪心思维② 二分查…

面试搜狐大模型算法工程师,体验真棒!!!

搜狐大模型算法工程师面试题 应聘岗位:搜狐大模型算法工程师 面试轮数: 整体面试感觉:偏简单 面试过程回顾 1. 自我介绍 在自我介绍环节,我清晰地阐述了个人基本信息、教育背景、工作经历和技能特长,展示了自信和沟通…

代码随想录算法训练营第 53 天 |卡码网110.字符串接龙 卡码网105.有向图的完全可达性 卡码网106.岛屿的周长

代码随想录算法训练营 Day53 代码随想录算法训练营第 53 天 |卡码网110.字符串接龙 卡码网105.有向图的完全可达性 卡码网106.岛屿的周长 目录 代码随想录算法训练营前言卡码网110.字符串接龙卡码网105.有向图的完全可达性卡码网106.岛屿的周长 一、卡码网110.字符串接龙1.题…

Java:StringBuilder、StringBuffer、StringJoiner

文章目录 StringBuilder代码为什么操作字符串建议使用StringBuilder,而不是String?但String还是不可替代的 StringBuffer案例:接收字符串,返回String类型的[11,22]这种形式代码 StringJoiner上面那个案例,用StringJoiner的方法解决…

Linux服务器不能使用su切换到其他用户

1. 现象 使用非root用户登录系统后,想使用su - 切换到root时,输入正确的密码后出现: 一开始以为自己密码记错了,或者是系统被入侵后篡改了root用户密码,服务器上的数据非常重要。后面不通过SSH连接,直接去…

2024年AI最热门行业人才:计算机视觉与自然语言及语音处理设计开发工程师!

2024年,计算机视觉设计与开发工程师以及自然语言及语音处理设计与开发工程师将成为技术行业中的“超级明星”。无论是智能家居、自动驾驶汽车,还是医疗诊断、金融服务,AI已经深刻融入我们的日常生活,而这些领域的智能化转型都离不…

《机器学习》决策树 集成学习 随机森林 参数及实例解析

目录 一、集成学习 1、含义 2、集成学习代表 1)bagging方法 2)boosting方法 3)stacking方法 二、随机森林 1、什么是随机森林 2、特点 1)数据采样随机 2)特征选取随机 3)森林 4)基分类器为…

LLAMA模型解析:快速掌握大模型LLM推理入门技巧

本文借助llama这个模型快速入门LLM的推理过程,技术细节很多都是通用的,也适合其他的LLM。本篇也可以作为CV快速入门NLP简易指南。 本文借助llama这个模型快速入门LLM的推理过程,很多技术细节都是通用的,也适合其他的LLM。这篇文章…

普元EOS-微前端调用base基座的ajax

1 前言 微前端调用EOS应用的服务或API,需要引入base基座,然后使用base基座中的ajax方法。 本文将介绍微前端的高开和低开使用base基座的Ajax的方法。 强烈建议不要自己引入axios或其他ajax库,因为EOS的服务接口都要求身份验证和授权&#…

分页查询面试记录和面试详情

文章目录 1.分页查询面试记录1.req和vo1.InterviewHistoryReq.java2.InterviewHistoryVO.java 2.InterviewController.java3.service1.InterviewHistoryService.java2.InterviewHistoryServiceImpl.java 4.测试 2.查询面试详情1.InterviewQuestionHistoryVO.java2.InterviewCon…

适合开发人员的网页爬虫工具DrissionPage

DrissionPage是一个基于Python的网页自动化工具,它集成了Selenium和Requests的功能,既能够控制浏览器进行用户界面的模拟操作,也能够直接收发数据包进行数据的获取和处理。 开源地址:DrissionPage: 基于python的网页自动化工具。既能控制浏览器,也能收发数据包。可兼顾浏…

CLion调试ROS(包括launch启动的ROS)

打开一个终端,切换到工作空间目录(形如:~/catkin_ws)。 在终端输入,source ./devel/setup.bash 启动Clion,一定要在输入上述命令的窗口启动Clion,否则会存在一些问题。 打开工程,这里也是一个…

【Java】——Java实现数组元素反转的两种方法

在编程中,我们经常会遇到需要对数组元素进行反转的需求。例如,给定一个整数数组arr {1, 2, 3, 4, 5},我们需要将其反转为{5, 4, 3, 2, 1}。下面我们将介绍两种实现数组元素反转的方法。 方法一:遍历数组一半的长度进行元素互换 …

Spring注解:优雅管理依赖的艺术

在Java企业级开发的广阔天地中,Spring框架以其强大的依赖注入(DI)和面向切面编程(AOP)能力,成为了众多开发者的首选。而Spring注解,作为这一框架的核心特性之一,更是将依赖管理提升到…

如何通过数字化资产管理提升企业运营效率

在当今快速发展的商业环境中,企业的资产管理正逐步向数字化迈进。数字化资产管理系统不仅帮助企业提高资产利用率,还能降低管理成本,提升整体运营效率。常达智能物联为各行业企业提供了领先的数字化资产管理解决方案,帮助企业实现…

AI入门指南(四):分类问题、回归问题、监督、半监督、无监督学习是什么?

文章目录 一、前言二、分类问题、回归问题是什么?分类问题概念常见算法分类问题的实际应用:银行贷款审批案例 回归问题概念常见算法回归问题实际应用:线性回归模型预测房价 小结 三、监督、半监督、非监督学习是什么?监督学习非监…