大模型产品经验漫谈

news2024/11/25 4:48:26

前文

昨天给领导汇报了最近做的一个 txt2sql 技术路线实现的智能助手的项目,总算是告一段落了,做了半年的时间,作为整个项目的技术负责人从头到尾主导项目,肯定是有不少收获和感悟的,趁现在还在脑袋里面热乎着,赶快总结一下,写的比较琐碎,想到哪里写到哪里。

起因

年初, AI 发展迅猛,领导感大有可为,遂立军令状誓要作一番事业,恰逢已有地下市政系统,WEB 需求已定,刚好在此基础上小试牛刀,于手机钉钉终端做一地下市政智能助手,耗时半年,终有小成。

团队配置

  • 经理 1 名,主要负责手机需求,设计交互,协调追踪各方进度
  • 后端 1 名,在钉钉实现后端业务
  • 数据生产兼测试 2 名,负责生产和测试相关样本
  • 算法 2 名,主要负责使用大模型实现项目目标

需求

要注意以下几点:

  • 是否真的有必要做成智能终端助手,不能盲目跟风,为了智能而智能,为了大模型而大模型,这是不对的,必须是要求充分必要的需求才行
  • 终端智能助手在定需求的思维方式上要和传统定开发需求的思维有明显区分,WEB 开发只需要按照需求展示出来固定的功能效果即可,相对比较死板,需求边界清楚。智能助手上面的问题灵活、抽象,我们既要明确限定需求边界,又需要适配此类需求,比如用户会问一些某些数据的分布概况。
  • 明确交互方式,这对于 UI 设计相对比较重要,什么样的交互方式更友好,更舒服,尤其是使用大模型本身在内容输出的形式比较单一,生成的结果速度比较慢
  • 明确最终的应用场景,什么人在用智能助手,什么时候用智能助手,怎么用智能助手,有没有特殊需求,等等都需要关注
  • 在收集需求,需求评审等阶段,一定要花大力气去做。
  • 还有一些特殊的需求,比如甲方能不能接受大模型的理念,甲方的环境可以部署大模型相关的应用吗,甲方的数据安全有保证吗,等等,哪一项都有可能把项目可行性干翻。

数据

要注意以下几点,一切以目标为导向,我们最终是要生成准确的 sql ,所以必须要朝这个方向使劲:

  • 可以根据需求精简表字段,感觉有些用不到的字段可以删除,减少最终的 prompt 长度,既能提升大模型的推理速度,又能提升其准确程度
  • 数据库中可以根据需求按照统一的单位预处理数据,方便后期写 sql 更加简洁,比如长度、面积等
  • 字段定义可以更加有区分度,清晰,便于大模型的准确理解和使用
  • 数据层面的优化,可以提升 sql 查询或者统计速度
  • 单表大规模数据如何进行优化,提升 sql 查询或者统计速度
  • 表之间区分度要高,如地铁站和地铁区间在用的时候容易错
  • 要在需求的基础上,跟团队信息协调一致,尤其是在前期制作样本的过程中,因为需求反复在变,信息一定要同步到位,否则样本质量堪忧
  • 在数据制作方面确实需要花费大精力去做,不能草草应付

解决方案

问题感知

因为涉及到多轮问答,所以问题感知是必须要做的一步,而且只能用大模型来做,我们用的是通义千问的接口。

问题路由

因为解决不同的问题需要不同的工具,所以如何正确选择出能解决问题的工具是个比较重要的课题,这肯定还是靠大模型去做,同时需要一定的策略,因为工具太多了,不可能一次都塞到 prompt 里面让大模型去分辨,这样影响速度和准确率。

生成 sql

这里结合了两种技术路线,主要的是 txt2api ,其次是 txt2sql,前者稳定性较好,可以解决大部分的需求,后者能够解决复杂类的需求,生成的 sql 稳定性较差。

另外 txt2sql 不可以用最简单的开源框架去做,存入向量数据库的数据如何存储,中间的核心部分 RAG 如何精准召回相关的业务要求,数据库表、字段信息、sql 书写方式等等,如何重排等等问题,都需要自己去调整。

使用这两种技术路线只能说解决大部分问题,但是仍然是有疑难问题存在,如下:

  • 超出现有表、字段的范围,或者强行“无中生有”,例如:项目的负责人,问项目表中没有的负责人信息。
  • 可能由于问题语义模糊不清、问题表述省略、字段定义不清楚、字段定义有冲突等等原因无法准处理,如:原西湖区xx小区。
  • 由于技术路线限制无法解决某些问题,如:建设单位和施工单位相同的项目
  • 复杂的逻辑、范围查询,如:大于等于、小于等于、非等,如:不是虾龙圩社区的地下停车场
  • 跨表查询
  • 问题描述中性介于统计和查询之间,无法区分到底如何解决,或者说用查询或者统计都对,但是影响测试指标,如:查询xx人防工程的防护单元数量、查询xx管线平均埋深

测试

  • 测试这块工作是同样的重头戏,因为靠大模型来生成的 sql 是很乱的,当然我们从技术层面已经规避了这个问题,但是如何和基准的 sql 比较仍然是个耗时耗力的工程,而且需要反复测试,这方面耗费的调用大模型的接口成本也会很高
  • 测试的指标要求一定要定清楚,我们这边只考虑准确率和速度
  • 测试出来的结果要标注合适的标签或者备注来便于反馈问题,一定要详细,开发会基于这些内容来修改问题,不断提升性能
  • 需求可能会持续变动,所以测试时候的各个层面的消息也要同步

大模型原生问题

这基本是大模型的原罪,和大模型本身的技术原理有关,很难规避。

  • 限流:通义千问 qwen-max 接口限制,每分钟只有 60 次,每分钟 token 不能超过 10 万,目前访问一次请求需要用通义千问的接口 5 次,tokens 消耗在 6000-8000 个
  • 并发:目前的并发应该不高,就算开发层面有,也会受限于第一条
  • 问题模糊导致理解不清楚,如:原西湖区xx小区,统计2023年全市管线项目的完成率,用工程类型统计
  • 不稳定:有时候能提出来有时候提不出来,原因不详,这种比较少见,但是出现过,怀疑是内部服务在更新
  • 泛化:对于问题中的本没有的参数会强行往某一个定义好的参数上靠,如:竣工时间与运管时间
  • 无中生有:在工作前期会自己生成没有规定的字段 distance

经验之谈

  • 将传统的需求搜集和评审的思路要转变为终端智能助手这种新形式
  • 不是所有项目都适合用大模型
  • 大模型不是万能的,不要什么都用大模型,可能传统的规则、深度学习效果比大模型更好更快,不能盲目跟风
  • 大模型的最大用处就是理解,但是就当下的大模型能力,理解能力也是效果有限的,不能盲目崇拜
  • 目前人工智能的定位就是辅助,切记
  • 需求在一直变动的情况下如何在开发和测试方面跟上进度是很考验能力的
  • 在选用 txt2sql 的技术架构的时候,细节都需要调整,不能拿来开源的就用,否则效果极差
  • 项目团队内部的信息同步极其重要,要以目标为导向,同步所有关键信息
  • 时间把控,如果是有经验的团队,两三个月打磨出一个关键的产品是很有希望的。但是像我们是第一次做只能摸石头过河,所以耗费了半年的时间。当然了就现阶段基本上大家都是在摸石头过河,市面上也没出现很多此类产品,可借鉴参考的内容不多。
  • 未来只要是查询类业务都可以做成智能助手,不一定高大上一步到位成为完全理想化的人工智能助手,只需要能辅助人们能够提升工作效率,交互更加简洁,解决实际的痛点,就是一个很好的智能助手,做到这个程度已经很难。
  • 多关注市面上的主流技术实现路线,产品形态等

在这里插入图片描述

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2135185.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

GPS/LBS/Wi-Fi定位,全安排!—合宙Air201资产定位模组LuatOS快速入门04

经历了hello world、点灯、远程控制三期基础教程,小伙伴们是不是收获满满,期待更高阶的应用呢? 本期,我们将学习合宙Air201的核心功能之一——定位功能! Air201定位示例教程 合宙Air201资产定位模组——是一个集成超…

SAP B1 Web Client MS Teams App集成连载一:先决条件/Prerequisites

一、先决条件/Prerequisites 在设置 SAP Business One 应用之前,确保您已具备以下各项:Before you set up the SAP Business One app, make sure you have acquired the following: 1.Microsoft Teams 管理员账户/A Microsoft Teams admin account 您需…

电力电子器件:二极管,晶闸管,GTO,GTR,MOSFET,IGBT

目录 1. 二极管 2. 晶闸管(SCR) 3. 门极关断晶闸管(GTO) 4. 门极可关断晶体管(GTR) 5. 金属氧化物半导体场效应晶体管(MOSFET) 6. 绝缘栅双极型晶体管(IGBT&#x…

HarmonyOS开发实战( Beta5.0)使用ArkUI的FrameNode扩展实现动态布局类框架详解

鸿蒙HarmonyOS开发往期必看: 最新版!“非常详细的” 鸿蒙HarmonyOS Next应用开发学习路线!(从零基础入门到精通) HarmonyOS NEXT应用开发性能实践总结 简介 在特定的节假日或活动节点,应用通常需要推送相…

【Unity新闻】Unity的产品命名变化

快速回顾一下Unity产品命名的调整。 在2023年 Unity就宣布版本命名的变化,将使用Unity 6作为最新版本的命名。 具体的规则,在论坛里进行了说明。 以后正式的LTS版本就是Unity 6,将在2024年末发布。 而不管是之前的Runtime费还是今天的费用…

短视频剪辑从简单到复杂,这四款很OK!

作为一个刚刚踏入视频剪辑世界的新手,我最近可是忙得不亦乐乎。我尝试了四款流行的视频剪辑软件,今天,就让我来和大家分享一下我的使用感受,看看哪款软件更适合我们这些初学者。这里先说一句,选择视频剪辑软件就像挑衣…

Python Module 模块详解:模块导入与项目管理的最佳实践

Python Module 模块详解:模块导入与项目管理的最佳实践 文章目录 Python Module 模块详解:模块导入与项目管理的最佳实践一 准备示例代码二 引用 module三 大型项目的模块管理四 完整文件示例五 源码地址 本文详细介绍了 Python 中模块(Modul…

yolo自动化项目实例解析(二)ui页面整理

我们在上一章整理main.py 的if __name__ __main__: 内容还留下面这一段, app QApplication(sys.argv) # 初始化Qt应用ratio screen_width / 2560 # 分辨率比例# 设置全局字体大小# 计算字体大小base_font_size 13# 基准字体大小,适合1920*1080分辨…

不要在这些场景中使用LLM或生成式AI

虽然但是,LLM并不是AI的全部,并不是所有的AI应用场景都适合生成式AI。 在某些用例中,应避免或极其谨慎地使用LLM和GenAI,二者可能并非最佳解决方案。 1. 高风险决策 LLM和生成式AI不适合做出可能对现实世界产生重大影响的高风险…

别人做谷歌seo为什么流量比你多?

如果你确认你的网站技术层面没有问题,那其实无非就是两方面,关键词没选好和用户体验不够好,不要妄想一步登天,选那些看起来搜索量很大的热门关键词,这种属于大家都在做,竞争是非常激烈的,在你的…

华宇TAS应用中间件斩获2024鲲鹏应用创新大赛北京赛区总决赛二等奖!

近日,以“数智未来 因你而来”为主题的创客北京2024鲲鹏应用创新大赛华鲲振宇北京赛区总决赛在北京鲲鹏联合创新中心圆满举办,华宇TAS应用中间件凭借产品竞争力、产品兼容性、技术领先性等优势脱颖而出,斩获鲲鹏原生开发赛道(泛政…

AI为云游戏带来的革新及解决方案:深度技术剖析与未来展望

近期,科技巨头埃隆马斯克与热门国产游戏《黑神话:悟空》的互动,再次引发了公众对AI技术在游戏产业中应用的关注。马斯克,作为特斯拉和SpaceX的掌门人,不仅在科技领域引领风骚,其个人兴趣也广泛涉猎&#xf…

关于使用Mybatis-Plus 自动填充功能失效问题

关于使用Mybatis-Plus 自动填充功能失效问题 关于使用Mybatis-Plus 自动填充功能失效 首先遇到的第一个问题 自动填充失败 或被填充为NULL 原因:字段类型 与 填充类型 不一致导致 解决方法:将类型替换成一致的类型 全部为Date 或 LocalDateTime 即可解…

828华为云征文 | 使用华为云X实例部署图数据库Virtuoso并存储6500万条大数据的完整过程与性能测评

前言 在大数据时代,图数据库以其强大的关系处理能力在复杂网络、社交媒体分析、知识图谱等领域得到了广泛应用。而在云计算的蓬勃发展下,使用云服务器进行图数据库的部署与管理变得更加方便高效。本篇文章将详细介绍如何在华为云X实例上部署开源图数据…

CANFD和CAN最主要的区别

随着汽车电子的高速发展,车内信息的急剧增多,传统的CAN总线的数据传输能力已经很难满足车辆ECU的数据传输需求了,此时CANFD就应运而生了。 CANFD和CAN最主要的区别就是CANFD的ID段和数据段能够以不同的速率传输数据,这就保证了即…

【大模型专栏—进阶篇】语言模型创新大总结——“后起之秀”

大模型专栏介绍 😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔本文为大模型专栏子篇,大模型专栏将持续更新,主要讲解大模型从入门到实战打怪升级。如有兴趣,欢迎您的阅读。 &#x1f4…

Prompt最佳实践|指定任务步骤,让ChatGPT不懵逼

在OpenAI的官方文档中已经提供了[Prompt Enginerring]的最佳实践,目的就是帮助用户更好的使用ChatGPT 编写优秀的提示词我一共总结了9个分类,本文讲解第4个分类:指定任务步骤 提供更多的细节要求模型扮演角色使用分隔符指定任务步骤提供样例…

e冒泡排序---复杂度O(X^2)

排序原理: 1.比较相邻的元素。如果前一个元素比后一个元素大,就交换这两个元素的位置。 2.对每一对相邻元素做同样的工作,从开始第一对元素到结尾的最后一对元素。最终最后位置的元素就是最大值, public class 冒泡排序 {public static void main(String[] args) {I…

点亮第一盏LED灯 4): stm32CubeMX配置时钟

嵌入式入门,继续点亮第一盏LED灯,在Stm32CubeMX这个图形界面,一共是需要配置2个地方,1是GPIO引脚,2是时钟,上一篇文章已经将引脚PC13配置为输出引脚,这个引脚需要输出的是低电平,这篇…

这才几天,京东又又又又又又加薪了!

京东 今天的最新消息,京东又又又又又加薪了。 距离我们 京东宣布大幅上调校招薪资 的推文发布才一周多点的时间,京东又宣布加薪了。 好家伙,算上这次,光 2024 年京东就已经宣布了 6 次调薪了: 2024 年初,京…