掘金AIGC时代,开发者更需要什么样的大模型?

news2024/10/6 4:26:07

 

当前,火热的AI大模型领域需要一些冷思考。

自去年年底ChatGPT掀起一轮AIGC热潮以来,国内科技企业扎堆发布大模型和类ChatGPT产品。截止2023年4月,已公开宣布发布或即将发布AI大模型的企业达数十家。多模态大模型的能力不断迭代,市场竞争加剧,同时监管意见及时出台,多重因素叠加让AI行业格局处在飞速变化中。

如何让大模型更广泛深入落地,在更多场景中把大模型的能力真正用起来,一直是AI产业界关注的焦点。当国内大部分大模型还停留在早期产品发布阶段时,2021年便问世的源大模型已经探索出了大模型商业落地的新路径。

老上海弄堂与AI大模型的碰撞

“怎么办理共有产权保障房?”

“失业补助金能领几个月,一个月多少钱?”

“养狗办证在哪里办,多少钱?”……

很多人以为,AI大模型更适合用来进行前沿科技等高大上的项目,其实不然。AI大模型的落地应用,也可以非常接地气。

2022年10月起,上海市静安区临汾街道的社区工作人员,在日常工作中已经用上了国内首个政务领域AI对话机器人“临小助”

“临小助”是基于2457亿参数的源大模型开发而来,它系统学习了民政、人社、房管等15个部门数百项服务类政策文档。工作人员只要在微信中向“临小助”提问,马上就能得到“正确答案”,即使是刚入职的社区小白也能“秒变”服务能人。

不仅如此,“临小助”还是社区培训的好助手。在社区治理高频情景中,“临小助”可以随时“扮演”群众,通过互动对话形式为社区工作者提供工作能力培训。目前“临小助”已经开设了加装电梯、业委会换届等8堂培训课程。

过去,需要数月时间的线下培训,通过“临小助”只要短短十分钟就能完成。试用阶段显示,某高频场景中,“临小助”让社区工作人员培训学习效率提升5倍,有效辅助问答建议达75%。

 

不过,比AI大模型深入弄堂更值得关注的是,“临小助”并不是科技公司推出的产品,而是源大模型开发者社区的开发者利用业余时间探索的应用。

2022年疫情期间,来自微软、百度、HTC等科技公司的几名AI开发者,希望通过AI技术减轻社区工作者的负担,开源的源大模型让他们仅利用业余时间就快速完成了产品开发与测试上线。

目前,“临小助”已落地上海多个街道社区,为众多基层社区工作者减负增能的同时,也为几名开发者带来了创业的第一桶金。

一直以来,人少事多是传统社区基层治理的核心难题。以上海为例,每个居委会通常由5~9人组成,但需要对接3500~5000名居民,平均每人要对接400~500人,日常工作多达119项。“临小助”这样的AI应用,对于数字政务和社区治理场景,有巨大商业价值和前景。

 

“临小助”并不是个例,在源大模型开源社区,另一批开发者积极探索“大模型+数字人”领域,在GitHub上推出了“一键构建专属你的数字人”的数字人生成平台Fay,也是优秀的大模型商业化探索案例。

Fay的最大价值在于,将语音识别、情绪分析、NLP处理、语音合成、表情动作输出等数字人核心模块做模块化处理,企业可以根据自身需求,像搭积木一样便捷地构建个性化的数字人助理。基于数字人生成平台Fay,深圳某公司打造了平板产品中的数字人个人助理,某主打情感陪伴的玩具公司也将开发的数字人融入到儿童玩具产品中。

当普通大众还在对AI将取代哪些工作感到焦虑时,越来越多AI开发者已经在利用大模型掘金。

那么,这些开发者是如何在短时间内就开发出具备商业价值的AI应用的?这就不得不提到现阶段大模型的商业模式。

“中国版ChatGPT”,离商业落地还有多远

ChatGPT是这一轮AIGC热潮中,最火爆的杀手级AI应用。相比产品与技术的迭代,AIGC新技术能否找到可持续可落地的商业模式也是产业界关注的重点。目前,国内国外类ChatGPT产品的商业模式大致有两种路径:

第一种模式:按使用量面向用户收费。如ChatGPT Plus、AI绘画平台Midjourney等,通过购买包月套餐,用户可以获得更快的生成速度和更高的内容生成质量。或者通过按API调用量付费,开发者可以基于基础模型进行个性化开发。

虽然ChatGPT短时间内吸引了全球一亿用户,但OpenAI仍是一家亏损中的创业公司。用户付费带来的收入,与前期巨大的研发投入和持续的算力消耗相比,让OpenAI何时盈利仍然是未知数。在算力成本方面,根据国盛证券报告《ChatGPT需要多少算力》估算,GPT-3训练一次成本约为140万美元,GPT-4的训练成本更是只多不少。

第二种模式:面向企业提供解决方案,这也是国内AI企业锚定的主要盈利模式。针对具备一定开发能力的企业,AI平台可以提供API接口、开发工具套件等,支持企业自定义开发自己的AIGC产品。针对更广泛的上游应用行业,则提供开箱即用的、相对通用化的AI应用。

然而,自大模型诞生以来,如何深入行业、场景一直是行业痛点。无论中外市场中,真正具备打造AI基础设施平台实力的企业不多。更多的企业,面临的关键问题是:如何将大模型的能力更好地与自身业务相结合。

这也是当前面对火爆的大模型领域,很多企业客户保持冷静观望的原因。一位头部企业级SaaS公司的高管向「智能进化论」透露,目前很多SaaS企业都在同时与多家国内AI平台企业接洽,他们最关心的是大模型究竟能为企业客户带来多少价值,毕竟各家大模型的实际效果还有待验证和评估。如何将平台的AI能力在自己深耕的领域用到最好,成了关键。

在上述两种主流的商业模式之外,源大模型则开启了另一条路:更彻底的开源。

 

2021年问世的源1.0大模型发布时便问鼎全球最大规模的中文AI模型,其参数规模高达2457亿,训练采用的中文数据集达5000GB,无论参数量还是数据集规模都比当时的GPT3领先不少。

开源开放是源大模型最具差异化的优势之一。为了降低AI开发门槛,源大模型开放平台已经向开发者开放:模型API、开源高质量中文数据集、模型训练代码、推理代码、应用代码、面向AI芯片的模型移植开发代码等资源。在开放平台的基础上,开发者无需从零开始,仅需完成少量代码就可以快速构建面向各种细分场景的AI应用。

目前,源大模型开放平台已汇聚超4000名行业开发者,覆盖互联网、金融、教科研、自动驾驶等领域。前面提到的“临小助”和数字人生成平台Fay都是在源大模型开源社区诞生的。而在开源大模型出现之前,个人开发者是不可能在这么短时间内开发出具备成熟商业价值的AI应用的。

为了帮助更多开发者便捷、高效地开发AI应用,源大模型还推出了丰富的开源开放平台和工具,比如APIExp工具可以让开发者直接通过网页与大模型交流,支持零代码调用和测试所有已开放的模型服务。Web应用Sandbox(沙箱)开发工具,让开发者仅修改少量代码,即可完成包含web交互的应用示例,快速验证业务逻辑和功能效果。

大模型时代,“安卓生态”初探

AI技术在不断向着祛魅和普惠的方向发展。ChatGPT及其背后的大模型只是这个过程中的一个关键节点。

过去,AI开发是作坊模式,一个场景一个模型,门槛高、周期长、成本高,AI开发只是少数实力雄厚的大公司才具备的能力。

大模型的出现改变了这一局面。将通用性和泛化能力强的大模型,经过下游场景微调,就可以批量产出适配各行各业的AI模型。大模型让企业及个人开发AI应用的成本和难度大大降低,这也是科技巨头纷纷布局大模型的核心原因。

下一阶段,AI开发新范式将进一步迭代,突破的关键在于如何激活千千万万开发者的创造力。

回顾移动互联网为代表的上一轮科技革命,开源的安卓系统,撬动了全球范围内开发者的无限创意,最终形成了移动互联网生态的繁荣。

在AI行业内,源大模型开放平台也在朝着“安卓生态”的方向加速进化。

首先,源大模型的开源程度是业界领先的,同时提供了完备的开发工具和平台,可以将AI开发门槛进一步降低,从而汇聚千行百业开发者,激发他们创新的势能。

其次,基于开源的基础模型,开发者可以开发出适合各种场景化的商业应用。基础模型相当于安卓系统,开发者开发的场景应用类似于安卓系统之上的各种APP,二者相互协同,相互促进,正在形成不断壮大的发展模式。

目前,靠开发者自发的力量,源开发者社区已经开发上线了数十款AI应用,包括AI剧本杀、反诈AI、心理咨询师陪练、数字演员、正能量陪伴机器人、抬杠机器人、游戏NPC对话、文案写作、金融文本分析等。

与企业主导的商业AI应用开发不同,源大模型充分释放了AI开发者的奇思妙想,极大提升了AI应用的丰富性和多样性。也让很多人第一次意识到,AI大模型其实可以深入很多生活工作的细分场景。

AIGC时代,创新的能力已经交付到每一个有创造力的个人手中。

如果说,大模型为AI技术深入千行百业打下了技术基础,那么源大模型对“安卓生态”模式的探索,开启了激活AI应用生态的路径,也让AI有机会飞入寻常百姓家。

***

作为AI开发者,如何借助开源大模型快速赚到创业第一桶金,赢在AIGC时代?

近日,源大模型开发者沙龙第6期将邀请到两支AI开发团队——数字栩生团队和Fay数字人开源项目团队,深入解读如何借助开源框架十分钟构建专属数字人,欢迎AI开发者共同探讨AIGC落地前景。

END

本文图片来自摄图网

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/445095.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023年自动化测试真有那么重要吗?内卷严重,测试技能水涨船高......

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 学习自动化测试有…

应用现代化语境下的技术重塑:谁在帮助企业自我革命?

文丨智能相对论 作者丨沈浪 在数字经济时代,应用现代化正在成为一个共识。在IDC发布的《IDC FutureScape:全球云计算2022年预测-中国启示》报告中,应用现代化就位居首位。同时,IDC也预测,到2025年,数字经…

更新 WinForms | InitializeComponent 的现代代码生成

当你使用 Visual Studio 中的 WinForms Designer 来创建一个 WinForms 表单或用户控件时,它并没有像 XML 或 HTML 那样的特殊定义或文件格式来表示用户界面。从一开始,WinForms 使用的唯一格式就是程序代码。在 WinForms Visual Basic 项目中定义的表单或…

ONES 联合中国信通院发布《中国企业软件研发管理白皮书》

4月20日,由 ONES 与中国信通院联合发起的《中国企业软件研发管理白皮书》发布会暨「软件质效沙龙一北京站」正式举行。发布会上,ONES 与中国信通院云计算与大数据研究所的各位领导、行业专家及众多软件从业者一起,聚焦研发管理热点动态&#…

【hello C++】内存管理

目录 前言: 1. C/C内存分布 2. C语言动态内存管理方式 3. C内存管理方式 3.1 new / delete 操作内置类型 3.2 new和delete操作自定义类型 4. operator new与operator delete函数 4.1 operator new与operator delete函数 5. new和delete的实现原理 5.1 内置类型 5.2…

杭州乐芯CNC 机器人采集方法汇总

杭州乐芯CNC数据采集方法及支持的系统 一,杭州乐芯CNC 机器人采集方法汇总 1,采用SDK开发包采集,比如发那科 FANUC \三菱 、海德汉、大隈OKUMA(O-API)、华中数控、凯恩帝、沙迪克、牧野电火花、台湾宝元、上海来钠克…

怎么把avi文件转换成mp4视频格式,4个高能方法

怎么把avi文件转换成mp4视频格式? 当您下载到avi格式的视频文件时,您可能会选择将其转换为MP4格式的文件。 avi是一种由微软开发的多媒体容器格式,尽管现在已经被认为是老旧的技术,但由于其简单易懂的开发API和Windows的通用性&am…

【CSS3】CSS3 2D 转换 - rotate 旋转 ② ( 使用 rotate 旋转绘制三角形 )

文章目录 一、使用 rotate 旋转绘制三角形二、代码示例 一、使用 rotate 旋转绘制三角形 使用 rotate 旋转绘制三角形 的原理 : 先绘制正方形 , 为该正方形设置边框 , 只设置 右侧 和 下方的 边框 , div {width: 40px;height: 40px;border-right: 2px solid black;border-bott…

tmux---linux终端复用器使用

tmux---linux终端复用器使用 tmux 介绍安装使用tmux会话管理新建会话分离会话接入会话杀死会话切换会话重命名会话 窗格操作划分窗格移动光标交换窗格位置窗格快捷键 tmux 介绍 命令行的典型使用方式是,打开一个终端窗口(terminal window,以…

发令枪音效芯片,语音提示ic

发令枪属于管制物品,只能在运动员训练或比赛时使用,其余时间段不能使用,更不能在非比赛场地公众场合使用。在径赛、游泳比赛等开始时,主要是用来发出声音信号的器械,形状像手枪。 电子发令枪,采用电子元器…

Baklib最佳实践:如何设计符合用户需求的FAQ页面?

在当今互联网时代,随着信息量的不断增加和用户信息获取方式的多样化,越来越多的公司、组织和个人开始创建自己的FAQ页面。作为一个企业或组织的“门面”,FAQ页面对于提升品牌形象、提高服务质量以及吸引潜在客户等方面都起着至关重要的作用。…

传统机器学习(三)聚类算法K-means(一)

传统机器学习(三)聚类算法K-means(一) 一、聚类算法K-means初识 1.1 算法概述 K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means基于欧式距离认为两个目标距离越近,相似度越大。 1.…

详解C语言string.h中常见的14个库函数(二)

本篇博客继续讲解string.h中的库函数。在上一篇博客中,我介绍了strlen, strcpy, strcat, strcmp这4个字符串操作函数,本篇博客会继续介绍strncpy, strncat, strncmp这3个类似的函数。 strcpy, strcat, strcmp这3个函数是长度不受限制的字符串操作函数&a…

ubuntu安装V2board宝塔面板教程

ubuntu安装V2board宝塔面板教程 运行环境:ubuntu-20.04 搭建宝塔web页面环境 切到linux服务器命令行 在用户目录下创建BT目录,进入BT目录 在BT目录下执行命令 sudo wget -O install.sh http://download.bt.cn/install/install-ubuntu_6.0.sh && sudo sh install.sh…

考虑梯水电站群的水火电节能调度(Python代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

oracle rac 安装文档

oracle rac 安装文档 一、前期准备1.1 操作系统centos 7.4 *2台,要求双网卡1.2 主机名:oracle01,oracle021.3 数据库版本:oracle 11g rac1.4 空间要求:1.4.1 系统:(系统使用磁盘)1.4…

python基于mediapipe开发构建人体姿态检测系统

之前做的人体姿态检测大都是基于openpose或者是yolo-pose之类的技术框架,这里主要是想基于一个开源的实现来完成人体姿态检测。首先看下效果图: Mediapipe是google的一个开源项目,支持跨平台的常用ML方案。项目在这里,如下所示&am…

软件挖掘|软件缺陷|蜕变关系

目录 软件无处不在 软件发展不是一个简单的任务 识别软件缺陷 软件缺陷定位 使用bug报告识别有缺陷的源代码 使用标准IR方法建模相关性 VSM rVSM 根据bug报告和源代码学习共享主题,并根据主题衡量相关度 学习结合大量手工制作的特性 如何建模&#xf…

页表结构详细说明

一、页表 1. 内存地址的分解 我们知道linux采用了分页机制,通常采用四级页表,页全局目录(PGD),页上级目录(PUD),页中间目录(PMD),页表(PTE)。如下: 其含义定义在arch/arm64/include/asm/pgtable-hwdef.…

应急响应 - Windows启动项分析,Windows计划任务分析,Windows服务分析

「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」:对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》 Windows应急响应 一、启动项分析1、msconfig2、gpedit.msc3、注册表4、msinfo325、启动菜…