关于大模型在产品开发中所面临的问题,利用大模型技术解决很简单!

news2025/1/11 19:46:51

具体问题具体分析,大模型技术没有统一的解决方案

有人说2024年是大模型应用的元年,而大模型在未来的发展潜力毋庸置疑,这也就意味着人工智能技术是下一个风口,因此各种各样基于大模型技术的创业公司如雨后春笋般涌现。

从应用的角度来说,大模型的主要应用有以下几个方向Agent,AIGC,聊天机器人等,严格来说聊天机器人应该属于基于大模型知识库的问答系统。

而随着多模态大模型的出现,大模型的应用场景变得更加丰富与强大,但这并不意味着基于大模型的产品就完美无缺,反而是问题多多。

大模型应用在不同方向所面临的问题

下面从应用的角度介绍一下大模型在各个应用方向上所面临的问题——AIGC, Agent,聊天机器人(知识库)

AIGC

AIGC是大模型应用的主要方向之一,所谓的AIGC就是AI生成内容,在AIGC之前还有PGC——专业生成内容和UGC——用户生成内容。

简单来说就是利用生成式AI的能力来生成文字,图像和视频等,替代或辅助人类进行创作。

当然,文字,图像,视频等只是AIGC应用的一个方向,其它还包括文档总结,视频总结,PPT,WORD处理,文生图,语音处理,数字人,人物仿真等多个细分方向。

图片

但对大部分创业公司来说,他们无力承担开发训练和微调模型的成本,因此他们只能选择第三方大模型来构建业务系统。但问题是,第三方模型虽然经过大量的数据训练,但其在具体领域并没有进行特定的微调或训练,因此它生成的内容质量就成了一个很大的问题。

举例来说,某公司正在做一个文生图或视频的AIGC工具,使用的是第三方大模型。这个模型经过大量的数据训练,并且经过精心的微调,在大部分场景之下表现的都不错。

但问题是,如果应用到某些细分领域内,比如说现如今传统文化兴起,大量自媒体创作者使用AI生成一些古风的视频;可能这个大模型能够满足这种大众化的需求,但如果你的需求是生成一个小蝌蚪找妈妈的视频可能就没那么好了。

原因是什么?

大模型就像一个人,每个人都有其擅长的领域,比如齐白石擅长画虾,徐悲鸿擅长画马,虽然他们都是从事的绘画领域,但每个人擅长的点不一样,大模型也是如此。

图片

因此,不论是在文本,图像,视频亦或者在其它AIGC领域,通用大模型都很难有良好的表现。

而如果想让大模型在某个方面表现的更好,那么就需要对大模型进行针对性训练,也就是微调;亦或者根据不同的场景开发一款新的大模型。

但这对很多公司是不现实的,不论是从成本上,还是从技术上,都很难做到。

想要解决这种问题,应该怎么办?

最好的方式就是把自己的业务限定在某个领域下的某个或某几个场景,而不是到处撒网,什么都想做。

Agent

智能体可以说是大模型技术的又一个主要应用方向,其主要技术就是通过大模型的自主规划能力,去自己分析问题,规划方案,然后调用外部工具完成任务。

举个例子,你是一个导游,你每天都需要发展新的游客,设计旅行方案,预订景点门票,住宿,饮食等。

如果使用Agent,你只需要告诉大模型我要做什么,大模型就能够帮你自动完成。比如让大模型帮你制定一份发展新游客,以及设计不同的旅行方案,同时还要考虑天气,路线等问题;并且,能够根据每个路线中的地点,制定详细的行程,以及安排好住宿与饮食等问题。

图片

这就是Agent的作用,通过大模型自身的规划能力,通过提示词和思维链等技术,来自动分析问题,并解决问题。

但目前来说Agent技术还不够成熟,原因就是大模型的推理与分析能力还不够强大;比如你让它帮你制定一份旅行计划,它制定的计划,可能是早上还在成都看熊猫,下午就要直接去云南看洱海,晚上住在北京王府井。

而正常的形成应该是早上去熊猫基地看熊猫,中午在附近吃点饭,下午回到市区,晚上逛一下锦里和宽窄巷子,然后住在武侯祠附近的酒店,这才是一个有可能完成的旅行计划。

目前Agent的发展趋势主要是,通过大模型的推理能力,以及外部工具,使用工作流的方式把它们整合成一个能够完成特定任务的Agent;然后使用多个不同功能的Agent来共同完成一个更加复杂的任务。

比如说字节的coze 扣子Agent平台。

因此,对Agent的应用来说,提升大模型的推理和规划能力才是重中之重,如果无法解决这个问题,那么Agent就很难能够发展。

知识库

知识库技术,严格来说即属于大模型的一个应用方向,也属于对大模型能力缺陷的一种补偿。

我们知道,大模型天生就知识短缺,因为它不会主动学习,因为它的知识永远都停止在之前的某一个节点,除非你对它重新进行训练或微调,否则大模型就一直是什么样。

还有一点就是,大模型的训练数据是有限的,其次就是过多的数据可能会导致过拟合问题;因此,大模型在某些领域表现并不怎么好,而这也是知识短缺的一种体现。

因此,知识库的作用就出现了,知识库是对大模型知识短缺的一个补偿;通过构建一个外部知识库,让大模型每次回答问题之前,都先去知识库里查询一下相关的资料,这样就能够做到有的放矢了。

而且,大模型一个非常严重的问题——幻觉问题,也可以通过知识库的方式得到优化,减缓幻觉出现的概率。虽然,幻觉问题不知道是否能够真正解决。

图片

而知识库同样面临着很多问题,知识库的难点主要不在大模型,而是在知识库的建设。

比如说,大量的资料数据怎么存储,存储完成之后怎么检索,怎么提升检索的效率与准确度;不同格式的资料数据怎么统一处理,怎么加载,怎么分析等等。

比如说,四大名著之《西游记》作为一本名著,如果把它加入到知识库中,然后用户想询问一些关于孙悟空的问题;怎么才能从《西游记》这本书中检索出相关性最高的内容。

比如说,孙猴子,孙悟空,齐天大圣,弼马温,泼猴,老孙等等都是和孙悟空相关的内容;那么用户输入其中的一种或几种,知识库是否能检索出相关度最高的内容。比如说是打白骨精,还是当弼马温,或者女儿国等等。

这就是知识库所技术所面临的问题,也是RAG(检索增强生成)技术需要考虑解决的问题。

总之,大模型的应用还处于探索阶段,大家都是摸着石头过河,而且在不同的应用领域所面临的问题还不一样;比如说AIGC领域主要是提高大模型的输出内容,解决方案就是训练和微调;而Agent领域需要解决的是大模型的推理和规划能力;而知识库系统需要解决的却是知识的存储与检索问题。

而无论个人或企业最多能做好其中的一点或两点,很难有人能同时解决这三个问题。

这就是大模型的应用,以及所面临的问题和解决方案。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2124928.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux云计算 |【第二阶段】SHELL-DAY5

主要内容: awk命令、内置变量(FS、$0、$1、$2、NF、NR)、过滤时机(BEGIN{}、{}、END{})、处理条件(正则、&&、||、~\!~、等)、awk数组、监控脚本、安全检测脚本 一、awk介绍 awk 是一…

【主机入侵检测】Wazuh解码器详解

前言 Wazuh 是一个开源的安全平台,它使用解码器(decoders)来从接收到的日志消息中提取信息。解码器将日志信息分割成字段,以便进行分析。Wazuh解码器使用XML语法,允许用户指定日志数据应该如何被解析和规范化。解码器的…

TP发邮件的功能如何实现?tp框架发送邮件?

tp发邮件系统如何设置发信?tp配置邮箱发送邮件方法? TP发邮件的功能,作为企业级应用中的一个关键模块,其稳定性和高效性直接影响到企业的日常运营。AokSend将深入探讨TP发邮件的功能如何实现,从基础配置到高级应用&am…

监控易监测对象及指标之:全面监控Oracle数据库

随着企业业务的不断增长和复杂化,Oracle数据库作为关键的业务数据管理系统,其性能和稳定性对于保障业务连续性至关重要。为了确保Oracle数据库的高效运行和稳定性能,对其进行全面监控成为了一项必要的工作。本文将基于监控易工具,…

搭建大模型知识库流程,以及基于langchain实现大模型知识库案例

“ RAG检索增强生成是为了解决大模型知识不足的问题 ” 大模型主要面临三个问题: 垂直领域内的知识不足 大模型知识有时间限制 大模型幻觉问题 第一个问题产生的原因是因为,没有经过垂直领域数据训练的大模型普遍表现不好;其次是目前的大…

新160个crackme - 054-vcrkme01

运行分析 需破解Name和Code PE分析 C程序,32位,无壳 静态分析&动态调试 ida找到关键字符串,双击进入函数 主函数静态分析,注释如上,还需要了解sub_401000函数 对sub_401000函数进行分析,注释如上&#…

半导体设备系列(2) 半导体设备与工厂控制仿真器Demo编写

可以用CS架构编写这两个仿真器,将设备写成服务器,接收来自工厂控制程序的命令。后续加上半导体设备通信协议。 半导体设备服务器 1)工程文件 QT core gui networkgreaterThan(QT_MAJOR_VERSION, 4): QT widgetsCONFIG c17# You ca…

linux 操作系统下的convertquota命令介绍和使用案例

linux 操作系统下的convertquota命令介绍和使用案例 convertquota命令介绍 convertquota是Linux系统中用于转换旧格式的用户和组配额文件的命令。它可以将旧格式的quota.user和quota.group文件转换为新格式的aquota.user和aquota.group文件。新格式的配额文件支持32位的uid/g…

有关WSL和docker的介绍

目录标题 如何利用在windows上配置docker实现linux和windows容器修改WSL默认安装(也就是linux子系统)目录到其他盘 如何利用在windows上配置docker实现linux和windows容器 wsl的基本命令:参考网页 docker入门到实践:参考网页 官方…

深度学习基础--卷积网络

图像的三个特性指出了专门模型架构的必要性。 首先,图像是高维的,一个用于分类任务的典型图像含有 224224 RGB 值(即,150528 个输入维度)。在全连接网络中,隐藏层的规模通常超过输入大小,因此&a…

uniapp中使用uni.$emit和uni.$on在vue和nvue页面之间传值但是无法赋值的问题

背景:我们在vue页面和nvue页面之间进行传值可以使用uni.$emit和uni.$onsh事件监听实现,官网描述:uni-app官网 (dcloud.net.cn)https://uniapp.dcloud.net.cn/api/window/communication.html#emit 而且官网上也明确说明了: 一、问…

SLMi33x系列SLMi330HCG-DG具有主动保护功能 兼容光耦的单通道带保护功能的隔离驱动器

SLMi33x系列SLMi330HCG-DG优势和亮点:国内首款带DESAT保护功能并兼容光耦驱动的IGBT/SiC隔离驱动器,5kVrms隔离电压和高达10kV的隔离浪涌电压,CMTI超过100kV/us SLMi330HCG-DG内置快速去饱和(DESAT) 故障检测功能、米勒钳位功能、漏极开路故…

棋牌灯控箱计时计费管理系统软件网关端口设置方法 佳易王麻将馆计时收银会员管理系统操作教程

一、前言 棋牌灯控箱计时计费管理系统软件网关端口设置方法 佳易王麻将馆计时收银会员管理系统操作教程 1、佳易王计时计费软件可接配套的灯控器 2、计时开灯则打开对应的灯 3、结账后自动关灯。 二、软件程序功能图文 1、当前计费方式可以按单价或时间段 2、软件解压即可…

永成分歧式防爆器Y-FBQ型

永成分歧式防爆器Y-FBQ型 当努力成为生活的常态, 生活就时刻充满期待, 深知每份订单都是信任, 品质和专业是我晒单的底气。 用途 型号为Y-FBQ型,分歧式防爆器是安装在瓦斯抽放管路中的简易防爆装置。此款产品主要由进气管、出气…

HarmonyOS开发5.0【rcp网络请求】

一 概述 现在鸿蒙的网络还不成熟,所以咱们需要对网络请求框架二次封装,并且避免业务方直接引用到,预防当有比较新的成熟性价比高的框架的替换,这个过程肯定是不可避免的 1.1 第三方比如 [axios]的js库迁移过来的[httpclient]通过socket&am…

Linux s3c2440 开发板上的操作系统实现 ubuntu

使用s3c2440开发板 使用ubuntu 1.ubuntu中的tftp,和nfs Trivial File Transfer Protocol,简单文件 传输协议。 通过网络在客户端与服务器之间进行简单文件 传输。提供不复杂、开销不大的文件传输服务。 Network File System,网络文件系统。通过 网络…

OpenStack概论和部署

目录 1.1 云计算概述 1.1.1 什么是云计算 1.laaS 2.PaaS 3.Saas 1.1.2 0penStack 概述 1.OpenStack 起源 2.什么是 Openstack 3.OpenStack 优势 1.2 安装方式 1.2.1 在线安装 1.配置系统基本环境 2.为系统设置阿里的仓库 3:设置kvm源 4:设…

【HarmonyOS】头像圆形裁剪功能之手势放大缩小,平移,双击缩放控制(三)

【HarmonyOS】头像裁剪之手势放大缩小,平移,双击缩放控制(三) 一、DEMO效果图: 二、开发思路: 使用矩阵变换控制图片的放大缩小和平移形态。 通过监听点击手势TapGesture,缩放手势PinchGes…

安泰功率放大器在压电马达中的应用实例

压电马达是一种利用压电效应的装置,通过在压电陶瓷上施加电场,引发其形变从而产生机械振动。在这个领域,功率放大器的应用为提高效率、精准控制和创新性应用提供了可能。下面将深入介绍功率放大器在压电马达中的实际应用例子。 压电效应是指在…

三维数字图像相关法(3D-DIC)用于复合材料力学性能测试

三维数字图像相关法(3D-DIC技术),通过将物体表面随机分布的斑点或伪随机分布的人工散斑场作为变形信息载体,是应用于计算机视觉技术的一种图像测量方法,是一种非接触的,用于全场三维坐标、位移、应变及运动…