MOdaHub魔搭社区:AI大模型应用落地的三大阻碍

news2024/11/25 16:37:11

目录

一是基于通用大模型研发行业大模型的难度。

二是私有数据的安全隐患。

三是落地成本的可控性。


To B 的探索并非现在才开始。自 ChatGPT 开放 API 插件以来,国内的多家云厂商在推出通用大模型时,也往往同步其对行业赋能的意愿。但大模型 To B 探索至今仍没有打破高墙,简单来说有三个维度的阻碍:

一是基于通用大模型研发行业大模型的难度。

从技术上来看,专业领域(如金融、医疗、法律)的行业大模型并非通过将数据喂给通用大模型进行精调就能轻松获得。例如,摩根大通 AI 研究院的一项研究已用实验证明,在金融领域,拥有行业私有数据的 BloombergGPT 在多个任务上的表现并没有比通用大模型更好:

这表明,当前行业大模型的技术瓶颈仍待突破。

过去十年的 AI 商业落地又告诉我们,定制化的项目落地模式难逃劳动密集型的「堆人力」结局,造成商业变现上的高投入、低回报局面,行业内不同企业之间又存在竞争关系,因此大多数人都认为:解决特定领域问题的行业大模型必须建立在通用大模型的基础上,即「基于标准化的定制化」、而非「彻头彻尾的定制化」。

也就是说,行业大模型的研发离不开通用大模型的能力。同时,还要有能为企业提供模型精调与训练的平台、稳定运行模型推理与应用的基础设施等。虽然行业模型的最终落地大概率是本地私有部署,但大多数应用的使用者也是广泛 C 端用户,因此长久稳定、充足可靠的系统资源也至关重要。

二是私有数据的安全隐患。

To B 场景中,大模型的买方与卖方间存在天然的信任障碍。一方面,企业担心自己的数据(如对话数据、内部代码、文档等)在接入公有大模型后泄露,通常要求私有化部署;但这种情况下,另一方面,大模型的提供方又担心技术机密泄漏。

市场上现有第三方公司提供模型微调训练的服务,可以帮助企业在开源模型的基础上训练企业自己所需的行业大模型,然后部署到企业本地的平台上。这类第三方公司不是大模型提供方,没有技术输出的忧虑,收费价格也不高,但企业与其合作仍需要出让自有的数据,且无法保证自家的数据不会被泄露给同行的竞对。

更值得注意的是,当前许多开源的大模型规定,基于其开源的应用不能用在商业用途,如 Meta 的 LLaMa。目前国内外只有极少数的大模型开放商用开源,百川智能最新推出的 baichuan-7B 是国内首家。因此,解决正规大模型提供方与企业用户在合作上的数据安全问题是首当其冲。

三是落地成本的可控性。

通常来说,企业调用大模型的成本有两块,一是模型训练的费用,二是模型推理(即模型应用与调优)的费用。

火山引擎智能算法负责人吴迪将这两块分别形容为大模型时代在算力上的「第一增长曲线」与「第二增长曲线」,其中第一增长曲线的结果已经得到验证,并预言两条曲线大约在 2024 年相遇(如下图)。而在第二增长曲线中,企业将扮演重要角色,大模型在行业的落地成本也主要体现在应用与调优上。

在《大模型时代的三道鸿沟》一文中,我们指出了企业应用大模型的一个「悖论」:企业希望在性能最好的大模型上做微调训练,然后再进行私有化部署。但在实际调用 API 的过程中,许多开源的大模型版本都是相对固定的,所以企业无法基于最新的模型版本进行微调。

国内大模型成果虽多,但企业在选定一家模型的过程中需要一一验证,时间与人力成本均难以把控。即使经过验证作出选择,也无法使用最新模型,这就降低了传统行业在大模型时代崛起早期的参与意愿,尤其降低付费意愿。

大模型的微调成本并不低。以 GPT-3.5 为例,未经调优的 API 价格是 0.02 美元,微调后的价格则变成了原来的 6 倍,即 0.12 美元。大模型的训练成本低,上线部署的价格才会降低。随着市场化的深入,大模型必将进入价格战,底层技术的比拼将成为模型卖方争取 B 端客户的终极杀手锏。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/722819.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

吸烟(抽烟)检测和识别1:吸烟(抽烟)数据集说明(含下载链接)

吸烟(抽烟)检测和识别1:吸烟(抽烟)数据集说明(含下载链接) 目录 吸烟(抽烟)检测和识别1:吸烟(抽烟)数据集说明(含下载链接) 1. 前言 2. 吸烟(抽烟)类别说明 3. 吸烟(抽烟)分类数据集 (1)smoking-dataset (2&…

内幕交易最高判终身监禁:韩国首部独立「加密法案」全文来了

2023年6月30日,韩国国会政务委员会通过了该国首部针对虚拟资产的立法——《虚拟资产用户保护法(가상자산 이용자 보호 등에 관한 법률안)》,目的是保护虚拟资产使用者及限制不公平交易,将在颁布一年后开始生效&#xf…

如何用 PowerPoint 制作滚动字幕

想知道如何使用 PowerPoint 制作滚动字幕吗?让您的演示更生动有趣!请紧跟以下教程,学习这个令人赞叹的技巧! 是不是你觉得自己制作的PPT过于呆板和无聊,而别人的PPT却充满了高级和趣味?原因在于你的PPT缺乏…

信创信创,有信难创

本土化产品,近年来备受追捧。比如馒头,成了更适合中国宝宝体质的欧包,有的创意馒头甚至可以卖出二十多元的“高价”;酱香饼,更适合中国宝宝体质的披萨;中药汤,更适合中国宝宝体质的咖啡…… 这样…

青岛大学_王卓老师【数据结构与算法】Week04_07_顺序表和链表的比较_学习笔记

本文是个人学习笔记,素材来自青岛大学王卓老师的教学视频。 一方面用于学习记录与分享,另一方面是想让更多的人看到这么好的《数据结构与算法》的学习视频。 如有侵权,请留言作删文处理。 课程视频链接: 数据结构与算法基础–…

uniapp实现腾讯地图定位,生成点,多点连线,清空点线,卫星地图等功能

功能: 1.地图上标点,点有内容,点击点后可以查看点的信息,详情 2.点击地图生成点,点击多个点后可以实现点连线功能 3.点击按钮后,可以把生成的点清空 4.卫星地图和默认地图切换功能 1.完整代码字段讲解 1.…

集成免费Chatgpt的WeTab安装与使用详解

集成免费Chatgpt的WeTab安装与使用详解 一、WeTab简介二、Chatgpt简介三、WeTab安装3.1 Edge浏览器在线安装教程3.2 Chrome浏览器在线安装教程 四、WeTab和ChatGPT的简单使用4.1 WeTab简单使用4.2 集成ChatGPT的简单使用 一、WeTab简介 WeTab是一款集成了多种实用工具的在线工…

第47步 深度学习图像识别:SqueezeNet建模(Pytorch)

基于WIN10的64位系统演示 一、写在前面 (1)SqueezeNet SqueezeNet是一种轻量级的深度神经网络架构,由Iandola等人在2016年提出。这种模型的最大特点是参数量极少,仅有510千个参数,而且模型大小只有5MB,比…

Simulink仿真模块 - Multiport Switch

Multiport Switch:基于控制信号选择输出信号 在仿真库中的位置为:Simulink / Signal Routing HDL Coder / Signal Routing 模型为: 双击模型打开参数设置界面为: 说明 Multiport Switch 模块用于确定将多个模块输入中的哪一个传递给输出。此模块根据第一个输入的值…

Nginx 安装 headers-more-nginx-module 扩展,隐藏www服务信息

通过Ubuntu APT安装的Nginx默认是没有扩展的,所以需要手动安装才可以。本文主要分享如何在 APT 安装 Nginx 的环境中安装 headers-more-nginx-module 扩展,隐藏www服务信息。 1、起因 今天收到一个高危漏洞的警告,该漏洞大意为:…

Fortran 中的函数与子程序

Fortran 中的函数与子程序 简介 Fortran 是不区分大小写的函数(Function): 函数是一段具有输入和输出的代码块,它接受一些输入参数,经过一系列计算后返回一个结果。 在Fortran中,函数的定义以关键字"…

【深度学习】1. yolov5 推理速度和batchsize的增长关系,推理并行处理多张图片,显存如何手动释放

文章目录 前言1. batchsize和推理速度的关系2. 修改batchsize尝试2.1 benifit(好处)2.1 编码batchsize下的推理2.2 发现问题2.2.1 推理结束后,占用显存不释放。 2.3 其它有用的参数设置 前言 yolov5的detect.py 是默认batchsize1的&#xff…

echarts 进度条 样式图表

示例图 代码 <!-- *flat-bar-chart *author yuge *date 2023/6/26 16:21 --> <template><div class"flat-bar-chart-main" ref"chartDiv"></div> </template><script> import * as echarts from echartsexport defau…

阿里云国际站:云原生数据库2.0时代,阿里云如何将云原生进行到底?

【猎云网上海】11月3日报道&#xff08;文/孙媛&#xff09; “PolarDB将云原生进行到底&#xff01;” 在2021年云栖大会上&#xff0c;阿里巴巴集团副总裁、阿里云智能数据库事业部总负责人李飞飞宣布了PolarDB实现三层解耦的重磅升级以及引领云原生数据库技术持续创新的态…

Java性能权威指南-总结25

Java性能权威指南-总结25 数据库性能的最佳实践随机数Java原生接口字符串的性能 数据库性能的最佳实践 随机数 Java7提供了3个标准的随机数生成器类&#xff1a;java.util.Random、java.util.concurrent.ThreadLocalRandom以及java.security.SecureRandom。这三个类在性能方面…

SpringBoot教学资料1-SpringBoot基础

SpringBoot简介 Spring Boot 优点 •可快速构建独立的Spring应用 •直接嵌入Tomcat(无需部署WAR文件) •提供依赖启动器简化构建配置 •极大程度的自动化配置Spring和第三方库 •提供生产就绪功能 •极少的代码生成和XML配置 •Spring Boot是基于Spring框架开发的全新框架&…

jenkins使用ftp工具,上传文件至服务器报错“Could not write file”

一、错误说明 使用ftp上传文件 ERROR: Exception when publishing, exception message [Could not write file. Server message: [553 Could not create file.]]11:12:45 FTP: Connecting from host [test-xxx-java-user-service-3-932ft-hsb69-t5wmf] 11:12:45 FTP: Conne…

『DotNetBrowser』.Net的浏览器嵌入组件,该选择DotNetBrowser 还是 CefSharp?

&#x1f4e3;读完这篇文章里你能收获到 全方位对比DotNetBrowser 和 CefSharp的优缺点 文章目录 一、引言二、引擎三、架构1. CefSharp架构2. DotNetBrowser架构 四、对比1. 稳定性和内存使用2. 应用程序域3. AnyCPU4. H.264, AAC5. 安全6. Visual Studio设计器7. 嵌入应用程…

通过DAPLink和STLink使用RTT输出日志

前提 阅读此文章的前提是已经移植好SEGGER RTT&#xff0c;如未移植请参考我的另一篇博客 《基于J-Link RTT Viewer输出日志(适用于JLink DAPLink STLink)》 由于SEGGER RTT 自带的 JLinkRTTViewer.exe 只支持自家的J-Link&#xff0c;所以使用DAPLink和STLink我们得另辟蹊径…

【设计模式】第二十一章:命令模式详解及应用案例

系列文章 【设计模式】七大设计原则 【设计模式】第一章&#xff1a;单例模式 【设计模式】第二章&#xff1a;工厂模式 【设计模式】第三章&#xff1a;建造者模式 【设计模式】第四章&#xff1a;原型模式 【设计模式】第五章&#xff1a;适配器模式 【设计模式】第六章&…