三个月诞生79个基础大模型,企业选用大模型需要注意些什么?

news2024/11/24 17:35:03

自从ChatGPT横空出世,各类大模型层出不穷,竞争也日渐激烈,可谓“乱花渐欲迷人眼”。

随着大公司的入场,无疑给创业公司带来了降维打击,创业公司随时可能倒掉,造成项目烂尾。

我也一直在关注大模型领域的最新进展,但当每天都有海量信息袭来时,我认为具有自己的独立思考框架、并持续保持是十分重要的,所以这里我也把近期的信息,并结合自己的思考分享给大家。

其实,相较于To C市场,我更关注To B市场,因为随着大模型逐渐进入深水区,向各个行业渗透也已经成为了必然趋势。

可预见地,未来所有的企业都会强依赖大模型,所有的产品都会基于大模型来开发。从长远考虑,大模型如何对商业世界产生真正的影响?才是下个阶段我们更应该关注的焦点。

一、《AI大模型技术能力评估报告》解读

目前,国内典型大模型包括:文心(百度)、M6(阿里)、盘古(华为)、ChatGLM(智谱科技) 、星火(科大讯飞)、日日新(商汤)等。

全球领先的IT市场研究和咨询公司IDC最新发布了《AI大模型技术能力评估报告,2023》,中国市场14个主流厂商参与了本次调研,IDC选取了9家大模型技术厂商进行重点研究,通过用户访谈调研,从用户关注的技术能力、产品功能、生态服务等方面进行了全面评估。

我之所以会关注这个报告,基于如下几点原因:

  1. 基于目前的国际态势,我认为国内一定会跑出一至两个大模型,可类比百度之于谷歌,阿里云之于AWS,这是我始终关注国产大模型进展的原因。
  2. IDC是国际权威咨询机构,行业认可度较高,所以该报告是具有权威性的。
  3. 本报告不单单基于技术角度对大模型进行评估,涵盖了算法能力、行业覆盖度、生态合作等等指标。我一直相信,不能闭门造车式的搞技术,曲高和寡往往意味着不切实际,技术终究是要服务于商业、服务于社会的。

我们再来具体看看IDC是怎么评估大模型的:

  1. IDC将大模型分为三层,即服务生态、产品技术以及行业应用。
  2. 对每一层的能力进行测评,主要考察指标为:算法模型、通用能力、创新能力、平台能力、安全可解释、大模型的应用行业以及配套服务和大模型生态等10余个指标(具体包括36项细颗粒度的评估标准),每个指标有1分-5分五个层级,得分越高代表厂商大模型技术能力越强,最终评估结果通过雷达图展示。
  3. 在大模型的选择上,IDC选取了中国市场9家大模型技术厂商进行重点研究,分别为阿里巴巴、百度、第四范式、科大讯飞、澜舟科技、云从科技、智谱AI、中国电信智科以及中科闻歌。除此之外,IDC还观察到了360、MiniMax、华为、商汤科技、腾讯等大模型。

ps:IDC也表示,会持续更新测评,涵盖更多技术厂商。

二、文心大模型的优异表现值得关注

值得一提的是,百度的文心大模型在此次评估中的表现十分亮眼,引起了我的注意。

其具体的表现如下:

七项核心指标满分(5分):算法模型、通用能力、创新能力、平台能力、生态合作、行业覆盖、能源行业;

三项国内唯一满分(5分):算法模型、行业覆盖、能源行业;

五项指标4分:安全可解释、服务能力、金融行业、工业行业、医疗行业。

下面两张图分别是文心大模型与其他国产模型的横向对比,以及文心大模型自身在各个指标中的评分:

这里我想额外说明一下“算法模型”和“行业覆盖”两个指标。

产品技术能力中,“算法模型”维度是最重要的,是大模型能力最为核心的要素,也是决定大模型应用效果的根本所在。只有通过算法模型技术的突破,实现具有通用效果优势的大模型底座,才能支撑更广泛的行业覆盖,才能使各行各业充分享受技术突破带来的红利,破解AI落地门槛高的困境。

在应用能力中,行业覆盖的广度是当下大模型厂商最为关注的指标。“行业覆盖”通过企业级客户数量和落地行业数,体现了大模型在产业落地上的实力,是大模型效果通用领先性、行业结合能力两方面的综合体现。

“算法模型”“行业覆盖”两个核心指标有其内在的关联性,行业覆盖的广度是算法模型通用领先性的集中体现,也将为算法模型能力持续提升提供源源不断的正向反馈,形成持续迭代提升的飞轮。

文心大模型获得了算法模型维度的唯一一个满分,体现了百度在大模型核心技术上的先发优势。百度自2019年开始深耕预训练模型研发,先后发布知识增强文心系列模型。近期的文心大模型3.5版本实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,新版本在效果、功能、性能都有了全面提升。

另外,除了本次的评估报告,其他多个公开测评显示,文心大模型3.5版支持下的文心一言中文能力突出,甚至有超出GPT-4 的表现;综合能力在评测中超过ChatGPT,遥遥领先于其他大模型。

在SuperCLUE最新测评榜单中,文心一言已经超越GPT3.5turbo,也超越GLM130B。

三、企业用大模型,要如何选择

基于《AI大模型技术能力评估报告》的结果,引发了我对于大模型选型问题的思考,既然上面我们说到:未来所有的企业都会强依赖大模型。

那么我们是应该选择商用模型还是开源模型,选择与大厂合作还是与初创公司合作?这些就成了绕不开的问题。

我先说我的结论:选择大厂的商用模型是最优选择。原因如下:

1、时间是最宝贵的资源

无论是对于刚起步的公司,还是已经具备一定规模的公司,想要在如今日渐激烈的市场谋求发展,最重要的资源是什么?是时间,这是一场和时间赛跑的游戏。

你这边在等一个开源模型从GPT-3的能力进化到GPT-3.5,而你的对手公司直接上了具有GPT-4能力的商用模型,无论从产品能力或用户体验上直接碾压你。所以从这个角度来看,选择商用大模型,是你取得先发优势的唯一选择。

2、对于To B大模型来说,行业经验远比参数重要

正如前文所说,闭门造车式的关注参数、规模是没有意义的,对于To B场景,积累的行业经验往往才是起到决定性作用的。

就我目前收集到的信息来看,百度在这个方面已经处于领跑地位,过去几个月,百度智能云在化工、制造、能源及汽车等大工业制造板块频繁有新的动作。比如,7月初,华晨宝马宣布与百度战略合作,双方称将共享优势资源,探索 AI 技术与汽车制造业全域场景的融合创新。上月,中国石化与百度战略合作协议,在行业人工智能基础设施建设、数字化转型升级与大模型等新技术创新等六大领域展开合作。电力行业里,5月,百度与南网总调签署备忘录,双方要共推AI与电力调度融合创新。

这也意味着,从各方面来说,百度的文心大模型无疑都已经基于其先发优势,处于了领跑地位。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/785519.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【深度学习】yolov 图片训练的时候的遇到的warning: corrupt JPEG restored and saved

报错原因 是图片在dataset.py 走验证时报的错误。 if im.format.lower() in (jpg, jpeg):with open(im_file, rb) as f:f.seek(-2, 2)if f.read() ! b\xff\xd9: # corrupt JPEGImageOps.exif_transpose(Image.open(im_file)).save(im_file, JPEG, subsampling0, quality100)m…

1-8 Burpsuite 漏洞扫描介绍

Burpsuite Scanner介绍 Burp Scanner的功能主要是用来自动检测web系统的各种漏洞,我们可以使用Burp Scanner代替我们手工去对系统进行普通漏洞类型的渗透测试,从而能使得我们把更多的精力放在那些必须要人工去验证的漏洞上。 进一步解放我们的生产力&a…

Spring Boot 中的日志

一、日志有什么用? 日志是程序的重要组成部分,想象一下,如果程序报错了,不让你打开控制台看日志,那么你能找到报错的原因吗? 答案是否定的,写程序不是买彩票,不能完全靠猜&#xf…

腾讯校园招聘技术类编程题汇总

题解&#xff1a;并查集&#xff08;模板&#xff09; #include <iostream> #include<map> using namespace std; int father[2000006]; int rank1[1000005]; void init(int n){for(int i1;i<1e5;i){father[i]i;rank1[i]1;} } int find(int x){if(father[x]x){…

数据可视化 - 动态柱状图

基础柱状图 通过Bar构建基础柱状图 from pyecharts.charts import Bar from pyecharts.options import LabelOpts # 使用Bar构建基础柱状图 bar Bar() # 添加X轴 bar.add_xaxis(["中国", "美国", "英国"]) # 添加Y轴 # 设置数值标签在右侧 b…

上门家政系统开发|上门预约家政小程序定制系统

随着人们生活水平的提高&#xff0c;对于家政服务的需求也越来越高。上门家政小程序的开发为家政服务商家提供了一个全新的经营和服务渠道。本文将介绍上门家政小程序适合的商家以及其优势。   1. 家政公司   家政公司是最直接受益于上门家政小程序开发的商家。通过开发家政…

AMEYA360代理线:ROHM开发出EcoGaN™减少服务器和AC适配器等的损耗和体积!

全球知名半导体制造商ROHM&#xff08;总部位于日本京都市&#xff09;面向数据服务器等工业设备和AC适配器等消费电子设备的一次侧电源*1&#xff0c;开发出集650V GaN HEMT*2和栅极驱动用驱动器等于一体的Power Stage IC“BM3G0xxMUV-LB”&#xff08;BM3G015MUV-LB、BM3G007…

【JavaEE初阶】HTTP协议

文章目录 1. HTTP概述和fiddler的使用1.1 HTTP是什么1.2 抓包工具fiddler的使用1.2.1 注意事项1.2.2 fiddler的使用 2. HTTP协议格式2.1 HTTP请求格式2.1.1 基本格式2.1.2 认识URL2.1.3 方法 2.2 请求报头关键字段2.3 HTTP响应格式2.3.1 基本格式2.3.2状态码 1. HTTP概述和fidd…

nginxWebUI runCmd命令执行漏洞复现

系统描述 NginxWebUI 是一款图形化管理 nginx 配置的工具&#xff0c;可以使用网页来快速配置 nginx单机与集群的各项功能&#xff0c;包括 http协议转发&#xff0c;tcp协议转发&#xff0c;反向代理&#xff0c;负载均衡&#xff0c;静态 html服务器&#xff0c;ssl证书自动申…

【Python机器学习】实验01 Numpy以及可视化回顾

文章目录 一、Numpy的基础知识实验1 生成由随机数组成的三通道图片&#xff0c;分别显示每个维度图片&#xff0c;并将三个通道的像素四周进行填充&#xff0c;分别从上下左右各填充若干数据。 二、Numpy的线性代数运算实验2 请准备一张图片&#xff0c;按照上面的过程进行矩阵…

磁场强度单位和磁感应强度单位转换

磁学量常用单位换算 、磁场强度单位和磁感应强度单位转换。 磁场单位 Oe&#xff08;奥斯特&#xff09;,A/m,T&#xff08;特斯拉&#xff09;三种. 1T1000mT 1mT10Gs 1Gs79.6A/m 1T(特斯拉)10000Gs(高斯)1Wb/M2 1Gs(高斯)1Oe(奥斯特)

C#实现系统进程的调用,查看进程调用的模块

1.需要使用命名空间&#xff1a;System.Diagnostics; 2.Process.GetProcess()可以获取所有进程 3.获取进程调用的模块 ProcessModuleCollection modules currentProcess.Modules; foreach循环一下FileName就可以查看调用了什么dll文件了 4.有关进程的信息&#xff08;Process…

最新基于Citespace、vosviewer、R语言文献计量学可视化分析技术及全流程文献可视化SCI论文高效写作方法

目录 专题一 文献计量学方法与应用简介 专题二 主题确定、检索与数据采集 专题三 VOSviewer可视化绘图精讲 专题四 Citespace可视化绘图精讲 专题五 R语言文献计量学绘图分析 专题六 论文写作 专题七 论文投稿 文献计量学是指用数学和统计学的方法&#xff0c;定量地分析…

线性神经网络——softmax 回归随笔【深度学习】【PyTorch】【d2l】

文章目录 3.2、softmax 回归3.2.1、softmax运算3.2.2、交叉熵损失函数3.2.3、PyTorch 从零实现 softmax 回归3.2.4、简单实现 softmax 回归 3.2、softmax 回归 3.2.1、softmax运算 softmax 函数是一种常用的激活函数&#xff0c;用于将实数向量转换为概率分布向量。它在多类别…

基于STM32F10x的独立按键测试

本人基于野火指南者开发板&#xff0c;使用FreeRTOS,创建按键任务。 在按键任务里面每隔20毫秒扫描一下按键。包括独立按键&#xff0c;矩阵按键(由于本人没有矩阵按键&#xff0c;故没有测试)。 按键40毫秒以上为短按、1秒以上则为长按、3秒以上则为一直按。且长按10秒以上则…

网络安全(黑客)自学基础到高阶路线

01 什么是网络安全 网络安全可以基于攻击和防御视角来分类&#xff0c;我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术&#xff0c;而“蓝队”、“安全运营”、“安全运维”则研究防御技术。 无论网络、Web、移动、桌面、云等哪个领域&#xff0c;都有攻与防两面…

Docker + MYSQL 启动nacos

Docker启动nacos默认用的是内存数据库&#xff0c;重启docker容器以后&#xff0c;nacos配置会丢失&#xff0c;非常不方便。所以需要修改为使用Mysql作为nacos的存储。 1.数据库 创建mysql数据库&#xff0c;过程省略&#xff0c;将nacos 的mysql脚本在数据库中进行导入。 m…

北航投资已投企业四象科技成功发射三颗卫星

1箭4星&#xff01;2023年7月23日10时50分&#xff0c;我国在太原卫星发射中心使用长征二号丁运载火箭&#xff0c;成功将四象科技“矿大南湖号”SAR遥感卫星、“虹口复兴号”光学遥感卫星、“中电农创号”热红外遥感卫星以及银河航天灵犀03星共4颗卫星发射升空&#xff0c;卫星…

当机器人变硬核:探索深度学习中的时间序列预测

收藏自&#xff1a;Wed, 15 Sep 2021 10:32:56 UTC 摘要&#xff1a;时间序列预测是机器学习和深度学习领域的一个重要应用&#xff0c;它可以用于预测未来趋势、分析数据模式和做出决策。本文将介绍一些基本概念和常用方法&#xff0c;并结合具体的案例&#xff0c;展示如何使…

7D透明屏的市场应用广泛,在智能家居中有哪些应用表现?

7D透明屏是一种新型的显示技术&#xff0c;它能够实现透明度高达70%以上的显示效果。这种屏幕可以应用于各种领域&#xff0c;如商业广告、展览展示、智能家居等&#xff0c;具有广阔的市场前景。 7D透明屏的工作原理是利用光学投影技术&#xff0c;将图像通过透明屏幕投射出来…