千帆大模型平台再升级:接入大模型最多、Prompt模板最全面

news2024/12/25 12:57:08

一、前言

近年来AI领域的发展取得了长足的进步,孵化出的相关产品可谓是如火如荼。尤其是最近爆火的ChatGPT,让非IT领域的其他领域的小伙伴也开始接触并使用它。其实它的爆火不是偶然,是因为ChatGPT实实在在的强大,真真切切的能解决实际应用中的问题,因此人们才会开始关注它,使用它。

其实国内也有不错的大模型平台,前几天我也对百度自行研发的大模型平台——文心千帆做了评测和分享,使用效果也是超出了预期的。

就在昨天,又看到百度团队对千帆大模型平台做了升级:全面接入Llama 2全系列、ChatGLM2-6BRWKV-4-WorldMPT-7B-InstructFalcon-7B33个大模型,成为国内拥有大模型最多的平台:

同时支持性能+安全的双重增强,模型推理成本可降低50%。另外,千帆大模型平台还上线了预置Prompt模板库,模板数量达103个,覆盖对话、游戏、编程、写作十余个场景。

看到这些升级,我又迫不及待的去试试了。下面将这次针对新特性使用过程分享给大家 。

文章目录

一、前言

二、使用分享

1)预置prompt模板体验

1.1 电影评论

1.2 Python解释器

三、总结

二、使用分享

1)预置prompt模板体验

听到prompt这个词可能大家会有些陌生,实际上我们每次对文心一言的提问就是一个prompt。但提问也是一门学问,一个清晰且准确的提问,得到的回答也一定是更准确的。举个例子:因胃痛去看医生时,你对医生说我肚子不舒服,那医生肯定得跟你产生很多的交互,逐个排查肚子范围内的其他器官后才能了解到你是胃不舒服。如果你直接对医生说我胃痛的话,那医生就会更针对性的进行治疗,会省去了很多中间过程。

因为prompt模板做的就是这个事情,百度预置的prompt模板就相当于更准确、清晰、标准化的提问。

在很多行业场景中,优化Prompt是一个关键工程,且非常依赖经验,如果自己去从0开始尝试探索一个标准化的Prompt模板也是需要花费不少精力和时间的。这次千帆大模型的升级,上线了103个预置prompt模板,百度把服务很多内外部客户的经验,包括Prompt工程专家的经验开放出来,形成了丰富的模版库:

那么使用prompt模板和不使用prompt模板会有什么区别呢?百度提供的这些prompt模板是否符合我们的业务场景需求呢?这里我针对自己感兴趣的电影和自己较为专业的Python领域,进行了验证:

 1.1 电影评论

如果我们想对“霸王别姬”这部电影写一篇影评的话,一般会直接对大模型说:“对霸王别姬写一篇影评”:

其实得到的回答效果也还不错,毕竟文心一言的能力还是很不错的,但细看下来对电影的评价不够全面、不够细致,而且我不希望出现剧透的情况,又希望对电影的配乐、特效等做更多的评价,所以这时可以使用prompt模板来看看会有什么样的效果:

百度提供的影评prompt模板是比较清晰全面的,因此语言模型输出的回答也就更加清晰全面,没有再出现剧透,也从各个角度对《霸王别姬》这部电影做出了分析和介绍,这样的回答也更符合我的预期。

1.2 Python解释器

这里从最基础的hello world开始,到列表序列化及冒泡排序来看看回答会有什么区别:

Hello world不使用模板

 Hello world使用模板

 序列化不使用模板

 序列化使用模板

 冒泡排序不使用模板

 冒泡排序使用模板

 可以看到,使用Python解释器的prompt模板后,文心一言会直观的将结果输出并对返回结果做说明。不使用模板的话则会对代码做详尽的解释和举例,这时更倾向于让我们搞懂代码的含义而不是结果的呈现。

体验下来,百度提供的预置prompt模板确实能更准确的表达出我想得到的效果,更符合我的预期。小伙伴们想体验prompt模板的话可以访问在线测试页,然后点击"prompt模板-预置模板"就可以引用预置的模板进行测试了:

 2)模型仓库

在模板仓库页,可以看到这次升级接入的LLaMA2全系列、RWKV等大模型,我们可以直接点击页面的部署使用它们:

 小伙伴可能会跟我刚开始时有一样的疑问:为什么千帆要接入这么多第三方的大模型呢?

这就要谈谈文心千帆的理念和目标了:千帆平台围绕企业的大模型应用需求设计,目标为企业用户提供全场景、一站式的大模型研发与服务工具链。当前开源大模型生态发展迅速,大量优质第三方模型涌现,在不同任务场景、参数量级与算力环境下体现出了差异化优势。千帆团队精选业界优质第三方模型,与平台无缝兼容集成,以便企业用户快速体验、测试、接入业务;与文心一言(ERNIE-Bot)等大模型搭配使用,从而更好满足不同细分场景的业务需求。

而且文心千帆也不是随随便便的就去接入三方的平台,它们是以三个维度(可商用、模型效果、模型安全性)为基础,通过层层考核才会接入这些模型。并且为了保证企业和开发者使用模型的安全性,千帆对所有接入的第三方模型均做了模型安全增强,不仅保障文心大模型的内容安全,还保障了第三方大模型的安全输出

除此之外,为了降低使用成本,千帆对每一个接入的大模型都做了二次性能增强。通过优化模型吞吐、降低模型尺寸,实现模型推理速度的大幅提升。据测算,调优后模型体积可压缩至25%-50%,推理成本可降低50%。这意味着,相较于直接调用,企业在千帆平台上使用这些模型可极大地节约成本,提升效果。

而且千帆对接入的大模型均做了深度适配,并提供模型再训练的全套工具链,支持多种形式模型调优,包括SFT(全量参数微调、Prompt TuningLora)及强化学习(奖励模型学习、强化学习训练)等。帮助企业和开发者快速基于基础大模型再训练,搭建企业专属大模型。

三、总结

这次体验效果依旧是很不错的,再一次的让我感到惊喜,也让我认识到并非“国外的月亮会才会圆”,国内同样也有不错的产品,甚至在某些方面的支持更加完善,支持的功能也更全面:

 除了全面和安全外,千帆平台也更加高效,在2022 年 11 月发布的 MLPerf Trainning v2.1 测试结果中,百度使用飞桨加百度百舸提交的模型训练性能结果,位列同等 GPU 配置下世界第一,端到端训练时间和训练吞吐均超越 NGC PyTorch 框架:

 而且千帆的服务模式也是多样化的,支持公有云服务和私有化部署:

 公有云提供三种服务模式:推理、微调、托管。适用于不同开发能力和不同需求的企业和开发者:

     1. 推理:直接调用通用大模型的核心推理能力,输出推理结果。

     2. 微调:在通用大模型的基础能力上,客户根据自己的需求,注入少量的行业数据,就可以用很小的成本微调出一个自己专属的大模型。

     3. 托管:通用大模型或者微调出来的行业大模型,都可以直接托管在百度智能云的云端。客户只管去使用大模型,百度智能云会确保大模型的高可用、高性能和高安全性,企业不用担心复杂的部署和管理问题。

私有化部署支持纯软件平台、软硬一体两种交付模式:

  1. 纯软件平台交付:提供在企业环境中运行的大模型服务。百度智能云将打包的AI软件系统授权给客户,由客户自行搭建部署在本地的数据中心或私有云环境中。百度负责软件的安装调试、培训与维护支持等服务。这种模式可以最大限度保障数据的隐私和控制权,但需要客户具备一定的AI运维能力,且承担相应的服务器成本。
  2. 软硬一体交付:百度智能云不仅授权AI软件系统给客户,还提供预配置好的AI服务器集群和存储系统一并交付。我们会负责整体解决方案的部署、调试和日常的技术支持与维护。我们可以提供端到端的服务与质保,而且在硬件价格上也提供一定的折扣。

即使有诸多优点和行业多个第一的加持下,我们还是得承认一点,国内的诸多大模型产品包括文心千帆与ChatGPT相比在语言模型方面还是存在一定的差距,但我相信在未来这个差距会随着各位“攻城狮”的努力以及各方面的支持会越来越小,甚至反超!希望小伙伴们多给它们一些时间、多提出一些建议让其变得越来越好。

小伙伴们可访问文心千帆大模型平台公有版测试服务 申请测试,看看它到底能否满足你们的需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/851980.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

痞子衡嵌入式:借助i.MXRT10xx系列INIT_VTOR功能可以缩短程序热重启时间

大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家分享的是借助i.MXRT10xx系列INIT_VTOR功能可以缩短程序热重启时间。 最近痞子衡写了篇文章 《i.MXRT从Serial NAND启动时间测量》,这篇文章详细测试了不同长度的 Non-XIP 程序在不同 …

Angular安全专辑 —— CSP防止XSS攻击

什么是 CSP(Content Security Policy) CSP(Content Security Policy)是一种Web安全策略,用于减轻和防止跨站脚本攻击(XSS)等安全漏洞。它通过允许网站管理员定义哪些资源可以加载到网页中&#…

【动态规划】数字三角形

算法提高课课堂笔记。 文章目录 摘花生题意思路代码 最低通行费题意思路代码 方格取数题意思路代码 摘花生 题目链接 Hello Kitty想摘点花生送给她喜欢的米老鼠。 她来到一片有网格状道路的矩形花生地(如下图),从西北角进去,东南角出来。 地里每个道…

解决GitHub超时上不去

Github对于开发者开发者开发者来说肯定不陌生,但是Github 经常连接不上显示超时,一般都是节点ip的问题。本文主要介绍一下如何通过修改 Hosts 提升 Github 访问速度。之前在 Hosts 文件有加入过节点,不过容易失效,所以自己得常更新…

A10VSO140EF7、A10VSO45ED71变量柱塞泵比例放大器

A10VSO18EF1、A10VSO28EF2、A10VSO45EF5、A10VSO71EF7、A10VSO100EF2、A10VSO140EF7、A10VSO45ED71、A10VSO71ER72、A10VSO100ED71、A10VSO140ER72、A10VSO180ER71比例变量柱塞泵电流信号实现电比例控制。 高精确度。 发生电源故障时的安全功能,例如制动和转向系统…

Python爬虫(八)_Requests的使用

Requests:让HTTP服务人类 虽然Python的标准库中urllib2模块中已经包含了平常我们使用的大多数功能,但是它的API使用起来让人感觉不太好,而Requests自称"HTTP for Humans",说明使用更简单方便。 Requests唯一的一个非转…

LeetCode--HOT100题(24)

目录 题目描述:234. 回文链表(简单)题目接口解题思路代码 PS: 题目描述:234. 回文链表(简单) 给你一个单链表的头节点 head ,请你判断该链表是否为回文链表。如果是,返回 true &…

微信-jssdk使用

需求: h5中使用微信的jsSDK,后续实现微信定位以及多图上传 微信文档 申请测试公众号 1.测试公众号进行配置 其中的域名是本地的ip地址 config接口进行权限配置,动态获取JS-SDK权限验证的签名 获取公众号accessToken以及jsTicket public static String WeChatAppId="wx…

Redis数据库的下载和安装

目录 第一章、Redis数据库的下载和安装1.1)nosql数据库和 Redis 介绍1.2)Windows中下载安装Redis数据库1.3)Linux中安装Redis数据库1.4)Linux中启动redis1.5)Linux中关闭redis 第二章、三种Redis客户端连接Redis数据库…

0804|IO进程线程day7 【重点】线程的同步互斥(互斥锁、信号量、条件变量的概念及基本操作)

线程的同步互斥中的两个概念:临界资源、临界区: 临界资源:当多个任务同时访问一个资源的时候,我们将该资源称之为临界资源。临界区:访问临界资源的代码,称之为临界区线程之间,如果要进行通信&am…

从少年变成恶龙的平台经济

点击文末“阅读原文”即可参与节目互动 剪辑、音频 / 卷圈 运营 / SandLiu 卷圈 监制 / 姝琦 封面 / 姝琦midjourney 产品统筹 / bobo 录音间 / 声湃轩北京站 东方甄选和抖音的“矛盾”再一次暴露出平台经济与入驻者之间微妙的关系。 平台经济,从一个引领时代…

人工智能有可能使下一代智力贫乏?

在ChatGPT推出之前,Maya认识的绝大多数大学生都会通过Google去完善自己的论文帮助。但人工智能之前的互联网其实是做不到真正的“高水平抄袭”,因为你根本无法找到复杂、具体、有创意或个性化的答案。 以上面提到的冲突解决课论文为例,写作要…

Effective Java笔记(30)优先考虑泛型方法

正如类可以从泛型中受益一般 ,方法也一样。静态工具方法尤其适合于泛型化 。 Collections 中的所有“算法”方法(例如 binarySearch 和 sort )都泛型化了 。 编写泛型方法与编写泛型类型相类似 。 例如下面这个方法,它返回两个集合…

实战项目ssm权限系统 3-自定义注解+AOP拦截器记录登录日志

一 登录日志以及操作操作日志的操作 1.1 登录日志配置收集 1.1.1 编写log入库的service层接口 1.接口:在spring-security模块中 2.实现类:在service-system模块中 3.dao层:在service-system模块中 1.1.2 过滤器添加log记录 在过滤器中&…

ArcGISPro中如何使用机器学习脚本

点击工程 打开包管理器,我们可以发现,无法修改ArcGIS自带的默认python环境,所以我们需将默认环境进行克隆 点击设置 设置要克隆的地方,点击确定 激活克隆的环境,然后重写启动ArcGISPro 搜索并点击需要安装的库&#xf…

virtualBox安装openEuler、virtualBox安装欧安镜像、openEuler镜像安装、虚拟安装openEuler

应领导要求,为后面系统改成国产操作系统+国产数据的要求,写一篇openEuler的文章。 第一步:下载openEuler镜像:openEuler下载 | 欧拉系统ISO镜像 | openEuler社区官网 选择对应版本:现在一般是64位,下载64位即可 第二步:下载virtualbox,个人下载的7.0.10:Downloads …

【PCL-7】PCL统计滤波

【PCL-1】RANSAC平面分割_pcl ransac平面_WXG1011的博客-CSDN博客 这篇博客已介绍直通滤波与体素滤波,这里主要记录统计滤波。 统计滤波是遍历计算各测点与其领域点的平均距离,以此为标量,假设为高斯正态分布,按标准差去除离群点…

OpenAI允许网站阻止其网络爬虫;谷歌推出类似Grammarly的语法检查功能

🦉 AI新闻 🚀 OpenAI推出新功能,允许网站阻止其网络爬虫抓取数据训练GPT模型 摘要:OpenAI最近推出了一个新功能,允许网站阻止其网络爬虫从其网站上抓取数据训练GPT模型。该功能通过在网站的Robots.txt文件中禁止GPTB…

使用 Etcher 制作U盘系统盘

Etcher 资料: https://github.com/balena-io/etcher/blob/master/SUPPORT.md

网络优化工程师,你到底了解多少?

5G网络优化工程师到底是什么? 5G,第五代移动通信技术(5th Generation Mobile Communication Technology,简称5G)是具有高速率、低时延和大连接特点的新一代宽带移动通信技术,5G通讯设施是实现人机物互联的…