从融云数智办公平台,看企业需要什么样的大模型?

news2024/9/16 11:32:52

本文中,我们将聚焦 ToB 领域,打开 AIGC 在 C 端社交泛娱乐之外的另一个切面,探索 B 端叙事的新变化。关注【融云 RongCloud】,了解协同办公平台更多干货。

过去两年,关于互联网大厂最多的消息当属裁员和关停非短期商业化项目了,但最近的舆论主基调则是“大模型战事”。

大模型,可以说是所有大厂都无法舍弃的互联网最后一个真命题,也是资本市场在新能源车之外为数不多的高回报机会。

这造成的直接结果是,厂商“不惜成本、加大投入”,从大模型参数“卷”到人才储备、研发投入及生态建设。最新一集的剧情则是,11 家大模型通过了《生成式人工智能服务管理暂行办法》备案。

根据媒体统计,他们是:

北京 5 家:百度(文心一言)、抖音(云雀)、百川智能(百川大模型)、智谱(智谱清言)、中科院(紫东太初);

上海 3 家:商汤(日日新大模型)、上海人工智能实验室(书生大模型)、Minimax(ABAB 大模型);

广东 2 家:腾讯(混元大模型)、华为(盘古大模型);

安徽 1 家:科大讯飞(星火大模型)。

备案意味着产品可以直接面向社会公众提供服务了,也意味着此前被抑制的产品扩散枷锁解除,必将促使更多厂商调整步伐和加快步调。

竞赛还没有结束,而是打开了一个高难度副本。


大模型的终极猜想

科技部《中国人工智能大模型地图研究报告》显示,截至 2023 年 5 月底,国内 10 亿级参数规模以上基础大模型至少已发布 79 个。

而根据赛迪顾问的统计,截至 7 月底,国产大模型累计发布数量达到了 130 个。假设两个统计口径相差不大,那大模型明显进入了加速通道。要知道,过去两年里,国内全年推出的大模型数量也不过 30 款左右。

那么问题来了,这么多大模型,到底能做什么用?除了吟诗作画说俏皮话,还有什么呢?

2021 年,斯坦福大学多位学者联合撰写的论文将经过大规模数据预训练的模型定义为基础模型,它们可以通过自然语言提示(prompts)适配到特定任务上,在大多数任务上取得了不错的效果。

如下图示,基础模型可以集中各种模态数据,然后适配各类下游任务

图源:On the Opportunities and Risks of Foundation Models

这也就是目前我们常说的通用大模型,一般支持文字和语音输入,可以生成文字、图片等 AIGC 内容。具体到 B 端,它们可以应用在营销、办公、编程、制定计划、客服等方面,辅助用户输出邮件、大纲、代码、规划等。

根据市场研究公司 SparkToro 与数据管理公司 Datos 的调研:ChatGPT 用户使用最多的场景是编程(占所有问答的 29.14%),教育是第二大使用场景,内容创作是第三大使用场景。

图源:Datos & SparkToro

但是,关于通用大模型,是不是覆盖场景越广越好?训练参数越大越好?随着行业的发展,人们的一些认知开始改变。

比如,大模型预训练数据量的比拼并不一定是好用与否的评判准则,暴力美学带来的涌现能力一定以惊人的成本为基础,但并不一定以更高的效率为结果

所以,相比大模型,中模型、小模型或许才是更好的选择。

小冰 CEO 李笛在媒体采访中做了一个简单划分:小模型参数量在 130 亿以下;中模型需要小几百亿参数;大模型则至少 650 亿参数。

他同时表示,在通用、泛化能力达到 ROI 平衡的情况下,模型越小越好。“一个 130 亿以下的模型,可以跑在 A100 单卡上,不用做分布式,不会出现大量问题。”成本更优的情况下,中模型、小模型可以提供人类能接受的响应延迟,这更符合经济学。

场景方面也是这样——适用任何场景是有价值的,也是有代价的。通用大模型可能会缺乏行业深度,无法保证数据隐私和安全。

GPT 等通用大模型极具颠覆性,但也有着不低的使用门槛。想要生成高质量内容,掌握方法提高提示词的精准度对用户来说是必须付出的学习成本。这就给有场景沉淀的行业模型提供了机会,开发者可以在通用模型基础上进行微调,以适配更具体的场景

营销内容创作工具 Jasper 就抓住这一需求,成为了一时风头无两的明星独角兽。其创始人是营销服务出身,掌握大量专业数据,并且已经建立了稳固的用户社群。Jasper 因此得以在用户反馈中快速迭代,通过各类实用模板降低了使用门槛,做出了产品差异化。

图源:Jasper

现在比较成熟的解决方案是,在通用大模型底座之上开发行业大模型。

互联网大厂每年研发投入资金高达百亿元,在大模型赛道上是当之无愧的“第一梯队”玩家。此外,商汤科技、科大讯飞、同花顺、孩子王等 AI 及行业公司也发力这个赛道。而他们的优势,就是在细分领域的积累。

根据钛媒体的梳理,在商务写作方面,科大讯飞的星⽕大模型成绩更优异。

图源:钛媒体

当然,评测或多或少有点应试教育的味道,打分和刷榜也不是大模型比拼的核心,只能提供有限的决策参考。

何况,在实际使用中,各行业的需求并不相同。一些对 AI 能力要求不高的企业,可以直接调用行业甚至通用大模型的能力;而要求特别复杂的企业,需要专属大模型。

比如,麦肯锡的“Lilli”让员工可以更轻松地访问他们多年积累下来的庞大知识库。其底层来自麦肯锡合作伙伴 Cohere 公司开发的大语言模型,利用麦肯锡的 10 万份内部文档和访谈记录训练而成。

拥有专属知识库和语料库的企业都可以打造属于自己的专属大模型,而相应地,每个人都拥有一个定制化个人大模型也是顺其自然的未来畅想。

这样,大模型的构成至少包括通用大模型行业大模型及面向 B 端的企业大模型和面向 C 端的个人大模型

不过,无论是哪种大模型,当务之急都是找到契合的场景和商业化客户。


大模型的 B 端业务渗透路径

我们在文章 AIGC,你看我还有机会吗?中对 AIGC 各层级的商业机会和发展逻辑进行了分享,引用了投资机构 a16z 对 AI 产业的划分:底层是算力基础设施,中间层是基础大模型,上层则是 AI 应用。

图源:a16z

国内互联网大厂向来喜欢既做“裁判”又当“运动员”,企图击穿底层算力、中层模型和上层应用,做“全栈”选手。

但是,如何将大模型的能力与行业场景有效结合永远是一道难题

抵达实践场景的路径,绝不是一条直线。

行业大模型的基础是场景化、企业专属大模型的基础是定制化,这与企业的数字化转型一样,要在通用能力基础上具备行业积累和企业实践

对千行百业都具备深刻的认知很难,拥有研发和微调能力的大模型厂商需要在提供通用模型的基础上,与掌握下游垂直、细分场景的行业生态协同共创,一起建立行业和企业大模型。

这样看,大模型进入 B 端业务,与融云作为安全、可信的数智化技术服务商的路径一样。

早在 2018 年,融云便以通讯中台能力与伙伴协作赋能政企协同工作场景,主要交付方式是作为通讯模块被集成于办公等各种系统中。

这种广泛集成能力需要背靠强大的产品服务能力。根据艾瑞咨询《2023 年全球互联网通信云行业研究报告》,融云 IM 连续多年稳居行业占有率第一。

图源:《2023 年全球互联网通信云行业研究报告》

融云通信服务被市场公认的优势之一便是“SDK / API 接口丰富且灵活”,拥有完善的 IM 产品矩阵和强大的消息分发机制,方便二次开发集成

与此同时,基于具体的业务场景,融云作为 PaaS 服务商,可提供组件化、模块化服务,具备灵活的上层诠释能力,与合作伙伴一起深入客户业务,一同寻求解决方案。

就是在这个过程中,融云以办公产品中的通讯能力为触角,探索和沉淀了政企办公在不同场景的业务能力。

在此基础上,融云基于亿级通讯技术打造了数智办公平台,为政府及企事业单位、公安军工、金融保险、交通、能源等行业客户提供高并发、高可用,组件灵活,安全可信的数智办公解决方案。

图源:2023 中国数字经济创新发展大会

深入场景、理解业务,才能更好地服务 B 端客户。大模型最终落地场景,还是需要走入更垂直、更开放的业务交互中。

从这个层面上来看,中国走过多年的数字化产业升级道路,可以为大模型赛道提供一定的借鉴意义。


AIGC 常看常新,我们也在学习中整理了一些颇有助益的行业报告、论文。感兴趣的朋友,敬请移步融云全球互联网通信云微信公众号,在对话框里发送“AIGC”即可获得这些资料。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/987963.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2.9 PE结构:重建导入表结构

脱壳修复是指在进行加壳保护后的二进制程序脱壳操作后,由于加壳操作的不同,有些程序的导入表可能会受到影响,导致脱壳后程序无法正常运行。因此,需要进行修复操作,将脱壳前的导入表覆盖到脱壳后的程序中,以…

速看!外滩大会发布银行数字科技5大趋势

通用人工智能风起云涌,金融行业将如何应对? 9月8日,由中国银行业协会指导,网商银行承办的外滩大会银行业数字化论坛上,IDC中国副总裁兼首席分析师武连峰发布了《银行数字科技五大趋势》:随身银行、AI风控、…

群晖(Synology)NAS 后台安装 Docker 后配置 PostgreSQL

群晖(Synology)NAS 的后台在新版本对 Docker 不再称为 Docker,现在改称为 Container Manager 了。 单击进入后运行 Container Manager。 PostgreSQL 容器 针对 PostgreSQL 的容器,我们选择容器后,如果你已经安装了 P…

buffer pool原理总结

innodb buffer pool原理总结 文章目录 innodb buffer pool原理总结1. 缓存的重要性2. innodb buffer pool2.1 buffer pool的内部组成2.2 FREE链表2.3 FLUSH链表2.4 LRU链表2.4.1 LRU链表的功能预读 1. 缓存的重要性 我们都知道,对于innodb存储引擎的表来说&#xf…

快手用户活跃度分析(未完成)

目标 为期30天的用户数据,但是不是所有的用户都有30天的信息数据,比如用户A第7天注册的,则其前6天没有数据。 预测未来用户活跃度的可能性。 预测7天后的,基于第7天,预测第14天,基于第8天,预测…

2023数模A题——定日镜场的优化问题

A题——定日镜场的优化问题 思路:该题主要考察的几何知识和天文学知识,需要不同角度下的镜面和遮挡情况。 资料获取 问题1: 若将吸收塔建于该圆形定日镜场中心,定日镜尺寸均为 6 m6 m,安装高度均为 4 m,且…

解密Kubernetes(K8s)集群的创建过程和关键步骤

文章目录 1. 准备环境2. 安装Docker3. 安装Kubernetes在Master节点上执行以下步骤:安装kubeadm、kubelet和kubectl初始化Master节点 在工作节点上执行以下步骤:加入集群 4. 设置Kubeconfig5. 安装网络插件6. 验证集群7. 部署应用程序8. 扩展和管理集群9.…

Weblogic反序列化漏洞

文章目录 1、搭建环境2、漏洞特征3、漏洞利用1)获取用户名密码2)后台上传shell 4、检测工具 1、搭建环境 漏洞环境基于vulhub搭建–进入weak_password的docker环境 sudo docker-compose up -d拉取靶场 2、漏洞特征 404特征Weblogic常用端口:7001 3、漏洞利用…

centos7使用docker-compose一键搭建mysql高可用主从集群

docker部署 环境准备 卸载旧版本 yum remove -y docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-latest-logrotate \docker-logrotate \docker-selinux \docker-engine-selinux \docker-engine 安装依赖 yum install -y yum-utils \…

PCB - 封装焊盘阻焊层的检查

文章目录 PCB - 封装焊盘阻焊层的检查概述检查做出的实际PCB正反面厂家提供的生产稿PCB对应的原始gerber文件查封装拿一个插件电阻为例插件封装焊盘的基本数据END PCB - 封装焊盘阻焊层的检查 概述 打样回来, 看到要焊接的几个插件管脚有阻焊, 无法焊接. 这几个封装是直接从第…

腾讯发布超千亿参数规模的混元大模型;深度学习与音乐分析与生成课程介绍

🦉 AI新闻 🚀 腾讯发布超千亿参数规模的混元大模型 摘要:腾讯在2023腾讯全球数字生态大会上发布混元大模型,该模型拥有超千亿的参数规模和超2万亿 tokens 的预训练语料。混元大模型将支持多轮对话、内容创作、逻辑推理、知识增强…

CleanShot X for mac安装下载,mac系统录屏、截图、标注软件

您是否经常需要截图、录屏或者标注图片?如果是,那么您一定会喜欢CleanShot X for mac,这是一款专为Mac用户设计的强大而简洁的工具。 CleanShot X for mac可以让您轻松地截取任何区域的屏幕,无论是整个屏幕、窗口还是选定的部分。…

Say Goodbye to OOM Crashes

内存管理 --- 在计算机编程中,内存管理是一项关键任务,用于在程序运行时正确分配和释放内存。一个有效的内存管理系统可以帮助程序提高性能,减少内存泄露和访问错误等问题。 内存管理涉及以下几个方面: 1. 内存分配&#xff1a…

MMDetection实验记录踩坑记录

AP值始终为0 在实验MMDetection的DAB-DETR模型进行实验时,AP值始终上不去。 可以看到,在第22个epoch时的AP值仅为0.002 因为在此之前已经运行过YOLOX,Faster-RCNN等模型,所以数据集的设置肯定是没有问题的,而博主也只是修改了DAB…

嵌入式学习笔记(18)代码重定位实战 下篇

adr和ldr伪指令的区别 ldr和adr都是伪指令,区别是ldr是长加载、adr是短加载。 adr指令加载的是运行时地址;ldr指令加载的是链接地址。 (通过反汇编文件可以深入分析adr和ldr的区别) 重定位(代码拷贝) …

行业Demo分享|「园区智慧安防可视化系统」实现园区安防全面保障

在当今社会,园区安全问题备受关注。**为了解决园区的安全隐患并提升安全管理水平,园区智慧安防可视化系统应运而生。**这一系统利用先进的技术手段,将智能监控与安全管理完美地融合在一起,并通过可视化的方式,为园区提…

无swing,高级javaSE毕业之贪吃蛇游戏(含模块构建,多线程监听服务)

JavaSE,无框架实现贪吃蛇 文章目录 JavaSE,无框架实现贪吃蛇1.整体思考2.可能的难点思考2.1 如何表示游戏界面2.2 如何渲染游戏界面2.3 如何让游戏动起来2.4 蛇如何移动 3.流程图制作4.模块划分5.模块完善5.0常量优化5.1监听键盘服务i.输入存储ii.键盘监…

win10 sourcetree打开一闪就退出

参考文档: 解决方案参考文档一: Solved: cant install Sourcetree on Windows 10Solved: when I double-click the installation file or run as administrator,I can see a splash screen and disappear in 10 seconds,then I open thehttps://community.atlassian.com/t5…

GoFrame框架

GoFrame框架 GoFrame简介第一个GoFrame应用使用GoFrame实现一个完整的用户案例GoFrame对象管理GoFrame配置管理-配置对象GoFrame配置管理-文件配置GoFrame日志组件GoFrame错误处理GoFrame数据校验GoFrame Web服务简介GoFrame Web服务-路由规则GoFrame Web服务-路由注册GoFrame…

长胜证券:A股三大指数缩量探底券商股逆势拉升

周四,A股全天低开低走,三大指数均跌超1%,创业板指领跌。截至收盘,上证综指报收3122.35点,跌落1.13%;深证成指报收10321.44点,跌落1.84%;创业板指报收2056.98点,跌落2.11%…