大模型落地难点之结构化输出

news2024/9/23 21:25:36

应用至上

2023年的世界人工智能大会(WAIC)是“百模大战”,今年WAIC的关键词是“应用至上”。纵观今年论坛热点话题,无论是具身智能还是AI Agent(智能体),都指向以大模型为代表的AI技术在不同场景下的垂直应用。

在这里插入图片描述

从模型输出看大模型应用的两种范式:

输出非结构化数据:问答机器人,智能客服,或者另一个大模型的上游输入,都属于这种范式。技术架构是(领域)大模型+RAG,对输出格式没有要求。

输出结构化数据:当需要把大模型嵌入到工作流中(尤其是原有的工作流),就需要大模型和原工作组件进行交互,在这种情况下,我们期望大模型的输出是结构化数据(Json)。

如何输出json

我们需要在prompt里面提示大模型,具体的提示词类似于:

Wrap the output in json tags. The output should be formatted as a JSON instance that conforms to the JSON schema below. As an example, for the schema {“properties”: {“foo”: {“title”: “Foo”, “description”: “a list of strings”, “type”: “array”, “items”: {“type”: “string”}}}, “required”: [“foo”]} the object {“foo”: [“bar”, “baz”]} is a well-formatted instance of the schema. The object {“properties”: {“foo”: [“bar”, “baz”]}} is not well-formatted. Here is the output schema:

OpenAI的json输出

去年的 DevDay 上,OpenAI 引入了JSON Schema,这是一项为开发者量身定做的工具,旨在帮助他们构建更为可靠的应用程序。尽管 JSON Schema 提高了模型生成有效 JSON 输出的准确性,但它并不保证响应能够完全符合特定的 schema 规范。为了克服这一限制,OpenAI 进一步推出了API的结构化输出特性,确保模型的输出能够精确匹配开发者所提供的 JSON Schema。

将非结构化输入转化为结构化数据是大模型(LLMs)的关键应用之一。开发者们利用 OpenAI API 构建出功能强大的智能助手,这些助手能够通过函数调用来获取数据、回答问题、提取结构化数据进行数据录入,以及构建多步骤的代理工作流程,从而让LLMs能够执行实际任务。

过去,开发者们通过使用开源工具、精心设计的提示以及不断尝试不同的请求,来解决LLMs在结构化数据生成方面的局限,确保模型的输出能够与他们的系统无缝对接。

现在,结构化输出功能通过强制模型遵循开发者指定的模式,并通过对模型进行更深入的复杂模式理解训练,有效地解决了这些问题。

Corner/Edge Case

考虑边缘情况的重要性:

边缘情况的考虑是确保系统鲁棒性的关键。在LeetCode等编程挑战中,全面性是区分优秀解决方案与普通方案的分水岭。同样,在将大型模型集成到工作流程中时,我们必须预见并处理所有可能的异常情况。

大型模型的概率本质:

尽管大型模型可能拥有高达99.99%的准确率,但概率论告诉我们,随着运行次数的增加,即使是极小的失败几率也会导致失败的发生。在一万次的运行中,至少有一次失败是不可避免的。

对大型模型输出的期望:

在我们的应用场景中,我们依赖大型模型提供符合预定义JSON Schema的输出。任何与预期不符的返回结果都可能导致工作流程的中断,影响整体的稳定性和效率。

错误的类型:

错误的类型可能多样,我们要主要关注以下几种情况:

  • JSON的合法性问题:非法的JSON结构可能导致解析错误,影响数据的进一步处理;

  • JSON层级问题:大型模型有时可能会在没有明确指示的情况下增加或减少嵌套层级,这会破坏预期的数据结构;

  • JSON key的问题:key的结果不符合约定,或者在value缺失的情况下,相应的key也可能意外地消失;

  • JSON key-value对应错误:当key相似时,可能会出现key-value错配的情况,即value被错误地关联到了错误的key上。

解决方案:

这些情况都有可能让工作流失败,所以一个好的方式是在给出结果前reflection下,保险的方式是做些校验

  • reflection:在模型输出前,我们可以通过reflection的方式,检查模型输出的结构,确保其符合预期的JSON Schema;这种方式适合对时延要求不高的场景;

  • Hard code校验:在模型输出后,我们可以通过校验的方式,检查模型输出的结构,确保其符合预期的JSON Schema;这种方式适合对时延要求较高的场景。

在这里插入图片描述

大模型&AI产品经理如何学习

求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。

1.学习路线图

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

在这里插入图片描述

在这里插入图片描述

(都打包成一块的了,不能一一展开,总共300多集)

因篇幅有限,仅展示部分资料,需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
在这里插入图片描述

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2081363.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一文道尽 RAG,为大模型提供你的私有知识

什么是 RAG?先说一个你可能不相信的事实:RAG 是2005年提出的古老技术(论文在此 https://arxiv.org/pdf/2005.11401)。然后我们先看一个学术定义:“检索增强生成(Retrieval-augmented Generation&#xff09…

【MATLAB源码-第198期】基于simulink的三相光伏并网仿真模拟。

操作环境: MATLAB 2022a 1、算法描述 三相光伏并网系统是一种将太阳能转换为电能并将其馈入电网的系统。这个系统通常包括光伏阵列、逆变器(包括其控制算法)、滤波器、电网连接和监控系统。从上载的框图中可以看出,该系统的设计…

最佳外推发帖器推荐

最佳外推发帖器推荐 外推发帖神器,节省90%发帖时间!#搜索留痕运营#百度留痕工具#灰色词排名代发#外推软件推广#B站专栏文章代发 推荐阅读: 哔哩哔哩b站文章专栏发布软件用真实信息注册域名的利弊https://www.bsw80.com/post/2314.html 今…

算法-有效的字母异位词

这道题很简单,就不做过多的解释,只需要创建一个哈希表统计s中出现的次数,然后遍历t,如果没找到,或者找到了但是次数为0则返回错误,否则返回true。代码如下: class Solution { public:bool isAn…

ADW300W/4G 配电改造智能电力仪表

安科瑞徐赟杰 近年来,随着工业和农业用电负荷的不断增加,现有的配电系统逐渐面临着供电效率低下、能源浪费严重等问题。然而,ADW300W/4G 配电改造智能电力仪表的问世,为解决这些问题提供了的解决方案。18(706165*067 …

vCenter 7 8 Unable to push signed certificate to host IP

报错 解决方式 选择主机和集群>选中最上面的vcenter>配置>设置>高级设置>点击编辑设置中通过过滤器搜索到vpxd.certmgmt.mode将值从默认的vmca更改为thumbprint保存官方更改证书模式

专业智慧厕所解决方案,智慧公厕厂家@卓振思众

在快节奏的城市生活中,公共设施的便捷性和舒适度成为了市民日常体验的重要组成部分。作为公共设施中的关键一环,厕所的智能化升级正在成为提升城市公共服务质量的重要趋势。智慧厕所,正以其先进的技术和人性化的设计,重新定义我们…

wordpress图片主题

源码介绍 原版主题源码是一款仿d音模式套图SEO源码,wordpress图片主题不送数据,此源码为wordpress模板,需先安装wordpress后才能使用!! 注意:PHP版本越高越好,PHP必须安装SG11扩展 代码下载

赛博朋克游戏 各种游戏定制开发 软件定制开发 游戏开发 区块链游戏开发

赛博朋克,是“控制论”与“朋克”的合成词。字面意思,就是对“机械文明”的反思。该背景大多描绘在未来,建立于“低端生活与未来科技结合”的基础上,拥有先进科学技术,再以一定程度崩坏的社会结构做对比。之后&#xf…

GNU/Linux - RSYSLOG

Getting started with RSYSLOG in Linux 用于日志处理的 Rocket-fast 系统(rsyslog)是 Linux 中提供的一个系统实用程序,支持消息日志。它具有高性能、出色的安全性和模块化设计。这是一个非常有用的工具,可以接受来自各种来源的输…

PTA - C语言国庆题集1

目录 7-1 阶梯电价7-2 求矩阵的最大值(设惟一)7-3 换硬币(鸡兔同笼)7-4 逆序输出一个整数的各位数字7-5 交换最小值7-6 分段函数27-7 数组中能被5整除的数的和7-8 统计字母出现的次数(hash思想)7-9 字母三角…

大语言模型-GLM-General Language Model Pretraining

一、背景信息: GLM是2020-2021年由智谱AI研究并发布的预训练语言模型。 GLM是一种基于自回归空白填充的通用预训练语言模型。 GLM 通过添加二维位置编码和允许任意顺序预测空白区域,改进了空白填充预训练,在NLU任务上超越了 BERT 和 T5。 GL…

游泳耳机品牌前十名大盘点:最值的10大精品游泳耳机实测分析

随着健康生活方式的普及,游泳已成为许多人首选的运动方式之一。在碧波荡漾的泳池中,或是在波涛汹涌的大海里,游泳不仅能够锻炼身体,还能让人心情愉悦。当运动与音乐相遇,一款优质的游泳耳机便成为了不可或缺的装备。它…

Maven的相关配置和语法解释

Maven的配置: Maven的配置和Java差不多,从镜像站下载相关的Maven版本压缩包,然后解压到自己的D盘,在进行系统变量的配置,新建变量Maven_HOME,然后值设置为Maven的地址,一定是点开文件后就能出现…

运动耳机哪个品牌好用?揭秘最值得购买的五大品牌!

开放式耳机设计不堵耳道,让用户听歌或打电话时还能听到周围的声音,这对喜欢户外运动的人很好。这种耳机戴着稳,舒服,也更安全。根据我自己的试戴体验,我挑出了几款不错的开放式耳机。接下来,让我们一起探讨…

RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术

RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术 在大模型爆发的时代,快速准确地从大量数据中检索出有价值的信息变得至关重要。检索增强生成(RAG)技术,结合了传统的信息检索和最新的大语…

更改了ip地址怎么改回来

在日常的网络使用中,‌我们有时会因为特定的需求更改设备的IP地址,‌比如解决IP冲突、‌访问特定网络资源或进行网络测试等。‌然而,‌更改IP地址后,‌我们可能又因为某些原因需要将IP地址改回原来的设置。‌本文将详细介绍如何改…

挑选适合的项目协同软件?看看这10款

文章主要介绍了以下10款项目协同进度软件:1.PingCode;2.Worktile;3.万户OA;4.小步外勤;5.智办事;6.万里牛;7.轻流;8.Toggl Track;9.Trello;10.Todoist。 在如…

程序员转行方向推荐

对于程序员转行方向的推荐,可以基于当前的技术趋势、市场需求以及程序员的个人技能和兴趣来综合考虑。以下是一些推荐的转行方向: 伴随着社会的发展,网络安全被列为国家安全战略的一部分,因此越来越多的行业开始迫切需要网安人员…

盘点国内热门的低代码/零代码平台,看看你用的哪一款?

什么是“低/零代码平台” “低/零代码平台”是一种应用开发工具,它们允许非开发人员,甚至完全没有编程背景的用户,通过可视化界面和预构建的模块,不需要或少量编写代码,通过拖拽组件、配置参数等方式快速搭建应用程序…