揭秘阿里新大招:大模型只是前菜

news2024/11/16 19:49:39

技术的代际变革往往对商业格局产生深远影响。眼下,随着产业各界对大模型的投入布局加深,一个业界共识逐渐诞生:大模型正在改变云生态,将为云计算行业带来新的奇点。

在过去的一段时间里,市场研究机构IDC在2022年底的预测报告中,将中国云计算行业在未来五年的平均增长速度下调了10%。这一调整是受到互联网行业整体增速放缓的影响,同时政企集成业务也在调整过程中。这些因素共同导致了互联网云厂商普遍降低了业务预期。

在此背景下,AI大模型就是这次的技术奇点,阿里云是这轮变革的主要推动者。4月11日,阿里云峰会上,阿里巴巴集团董事会主席兼CEO张勇首次以阿里云智能CEO的身份亮相,旗下大模型产品“通义千问”随即面世。

活动现场,张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,钉钉、天猫精灵已率先接入通义千问测试,并会在评估认证后正式发布新功能;阿里云智能集团CTO周靖人称,通义千问将基于阿里云基础设施向企业开放,企业可以在阿里云上训练企业自己的行业、垂类大模型。

从已知信息可以推断出,阿里巴巴对于“通义千问”项目的战略部署,并未仅仅将目光停留在类GPT模型的领域,而是着眼于未来更为广阔和深远的应用场景,展示出雄心勃勃的远景规划。

将把通义千问“装进”阿里所有产品

在此次峰会上,张勇郑重宣布,未来阿里巴巴旗下的所有产品将与“通义千问”大模型进行整合,实现全面的革新与升级。

“AI大模型的出现是一个划时代的里程碑,人类将进入到一个全新的智能化时代。就像工业革命一样,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。”张勇表示。

拿钉钉、天猫精灵来说,钉钉在接入“通义千问”后增加了近10项新AI功能,通过类似微软Copilot(副驾驶)的设定,用户可以随地唤醒AI来辅助日常的工作。

具体而言,根据钉钉当天预告的Demo演示,接入“通义千问”之后:

在群聊场景中,钉钉在你被加入新的群聊时,能够依据群内过往的对话记录,智能生成一份聊天概要。这一功能旨在帮助用户迅速掌握讨论主题和上下文,免去繁琐的手动回顾过程,提高沟通效率。

在钉钉文档场景中,“通义千问”展现出了全方位的办公辅助能力,无论是创作诗歌、小说、撰写电子邮件,还是制定营销策划方案等多种任务,均可得心应手。此外,除了生成各类文案内容,它还具备根据指令智能生成创意图片的能力,为工作带来更多便捷与灵感。

在钉钉会议应用中,“通义千问”具备实时生成会议记录的能力,并能自动梳理出会议纪要和待办事项,提升会议效率。此外,钉钉视频会议还支持实时字幕功能,让参会者不仅能看到发言内容,还能清楚了解谁在发言。同时,新加入的会议成员可以通过智能摘要迅速掌握之前的讨论内容。在会议结束后,钉钉还可为参会者生成重点摘要和待办事项,帮助参会者高效安排后续工作。

令人眼前一亮的是,钉钉展示了一种基于拍照生成小程序的场景。用户只需上传一张功能设计草图,就能实现低代码业务应用的快速生成,无需编写代码便可创建出一款实用的应用。如此创新使得应用开发的门槛得到了进一步降低,为广大用户带来更多便捷。

钉钉之外,“通义千问”在天猫精灵上的表现同样不俗。

依据天猫精灵官方展示的演示Demo,接入“通义千问”后,新一代的天猫精灵将具备更为灵活的对话能力。它能够根据用户的实际需求以及所处场景,实时生成相应的内容,为用户带来更为智能化和个性化的互动体验。

例如,用户在跑步过程中,可以要求天猫精灵“根据180步频合成适合跑步的歌单”,同时还能与天猫精灵展开关于文化、人生等领域的深入交流。得益于“通义千问”强大的技术支持,天猫精灵的用户体验将更具智能化、便捷性和多样化特点,为用户带来更高品质的服务。

淘宝天猫的电商业务,也有大量场景适合大模型切入。例如,以文搜图、智能客服、卖点文案生成等。这将使购物体验变化巨大,用户可以在需求模糊的情况下,通过更智能的交互直接找到合适的商品推荐。

可以设想,在未来阿里巴巴所有产品成功接入“通义千问”大语言模型并实现全面升级后,各种各样的生活场景都有可能面临AI带来的应用方式的彻底改变和革新。这将为日常生活带来前所未有的便捷性和智能化体验。


大模型生态“活水”

以上,阿里巴巴的“通义千问”主要是与集团内部产品相结合,以提升产品性能和用户体验。然而,除了内部产品协同发展之外,阿里巴巴的大语言模型同样具有一条面向外部生态的路线。

现阶段,老牌互联网巨头和人工智能新秀们纷纷押注大模型技术,期望从中获得更大的商业价值和科技突破。这种盛状使得大模型技术成为了科技领域的一股新风潮。

目前,大模型技术已经取得了令人瞩目的成果,大型预训练模型在自然语言处理、文本生成、知识问答等方面表现出了惊人的能力。这些大模型在很多领域已经开始实现商业化应用,比如智能客服、内容推荐、智能写作等。

然而,随着大模型技术的盛行,也引发了一些担忧。譬如,大模型需要大量的计算资源和数据,这使得研发门槛日益提高,可能导致只有少数科技巨头才能参与竞争。在某种程度上,这已经形成了国内人工智能发展的重要瓶颈。

对此,此次云峰会,张勇表示,面向 AI 时代,所有产品都值得用大模型重做一次,为此,阿里云也希望帮助更多企业用上大模型,让每家企业都能基于“通义千问”,拥有具备自己行业能力的专属大模型。

换句话说,在阿里巴巴提供的强大算力基础设施、先进的机器学习平台以及大模型服务的支持下,企业们不再需要浪费时间和精力去“reinventing the wheel”或是陷入针对大模型通用能力的无谓竞争。

相反,他们可以将更多关注集中在开发具有原创性和专属特点的模型上,以推动行业的持续创新。

周靖人进一步解释称,在未来的阿里云平台上,各个企业不仅能够充分利用通义千问的全面能力,还能根据自身所在行业的特点和具体应用场景,培训和定制自家的企业级大模型。举例来说,每家企业都有可能拥有自己专属的智能客服、智能导购、语音助手、文案撰写助手、AI设计师以及自动驾驶等相关模型。

作为印证,发布会现场阿里云宣布将与OPPO安第斯智能云携手共建OPPO大模型基础设施,借助通义千问实现大模型的持续学习、精细调整以及前端提示工程。此外,诸如中兴通讯、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登和掌阅科技等多家知名企业亦表示,他们将与阿里云在大模型相关领域展开技术合作的探讨与共同创新。

为推广基于模型开发人工智能的新开发方式,除了开放大模型外,阿里云也在积极建设开源的AI社区生态。

在2022年11月,阿里云率先提出了“Model as a Service”的创新理念,并随后推出了国内首个AI模型社区“魔搭”。在这个平台上,开发者们可以轻松下载各种开源AI模型,同时直接利用阿里云的强大计算能力和一站式的AI大模型训练及推理服务。

仅仅几个月里,已经有超过百万用户共下载了1600万次各类模型。与此同时,平台上可用的模型数量也从最初的三百多个迅速扩展至八百多个。在这些模型中,参数数量超过十亿的大模型有三十多个,而超过百亿参数的大模型更是达到了10个。

从这里来看,关于大模型生态的篇章才刚刚揭开序幕。


阿里大模型的底气:AI基础设施内功

从长远的角度来看,要实现“通义千问”在各行各业的广泛应用,离不开智能化技术的支持,以及在算力、算法和大数据等方面的技术优化。这些技术优势正是阿里巴巴多年来不懈努力和技术积淀的成果。

拿大模型技术来说。公开资料显示,阿里云从2019年就开始同时研究多模态大模型和语言大模型。2021年,阿里巴巴达摩院相继推出了语言大模型Plug以及多模态大模型M6。随后在2022年9月,阿里大模型融合为“阿里通义大模型系列”。

不仅如此,大模型的训练和运行背后同样需要强大的算力基础。这些算力要求包括以下几个方面:

高性能计算硬件,大模型需要大量的计算资源,例如高性能的图形处理器(GPU)、专用的AI芯片;分布式计算,由于大模型的参数数量和计算复杂度非常高,单个计算设备很难满足其需求;高效的算法和优化技术,为了降低大模型的训练时间和计算成本,研究人员需要开发高效的算法和优化技术。

总之,大模型背后需要强大的算力基础,包括高性能计算硬件、分布式计算框架、高效的算法和优化技术以及大量的训练数据和存储资源。这些因素共同支撑着大模型的成功运行。

对此,阿里云做了充足准备。在峰会上,张勇表示,十多年来,阿里云已经累积了从飞天云操作系统、芯片到智算平台的“AI+云计算”的全栈技术实力,并在IaaS(基础设施即服务)和PaaS(平台即服务)的基础上,建立了第三层MaaS(模型即服务)的体系。

具体而言,“飞天智算基础设施”智算IaaS服务涵盖了一系列卓越特性,包括能够支持高达十万卡GPU的单集群规模、可让多个万亿参数大模型同时在线训练的强大智算集群,以及为万卡规模AI集群提供无拥塞通讯的自主研发RDMA网络架构等;

智算PaaS服务则以机器学习平台PAI为核心,可支持万卡的单任务分布式训练规模,AI训练效率提升可达10倍,推理效率提升可达6倍,覆盖全链路AI开发工具与大数据服务,深度支持了通义大模型的研发;

智算MaaS服务包括通义大模型系列和以之为基础的企业定制大模型。

以上这些表明,阿里云不仅致力于为自家大模型“通义千问”打造坚实的技术基础,而且还将把丰富的算力资源和大模型能力分享给更多企业和社会各界,共同推动AI技术的发展。

可以看到,凭借长期积累的技术实力与研发投入,阿里巴巴在大语言模型相关技术的竞争中表现出色,在中国乃至全球范围内,均展现出了卓越的综合实力与竞争优势。

也正是在此技术基础上,除了大模型这盘前菜之外,无论是阿里巴巴全面实施大模型改造其旗下所有产品的智能化进程,亦或是面向外部生态的大模型路线,这两盘“猛菜”共同构成了阿里巴巴别出心裁的战略布局。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/410495.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Unity和Visual studio开发调试环境配置-工具插件安装和配置

在Unity开发中,常用C#脚本进行功能开发,需要用到Visual Studio进行开发和调试,需要分别在Unity3d和Visual Studio中安装插件和工具才能更好的进行开发和调试。 visual studio安装Unity扩展工具 visual studio中“工具”→“获取工具和功能”…

Leetcode.1019 链表中的下一个更大节点

题目链接 Leetcode.1019 链表中的下一个更大节点 Rating : 1571 题目描述 给定一个长度为 n 的链表 head 对于列表中的每个节点,查找下一个 更大节点 的值。也就是说,对于每个节点,找到它旁边的第一个节点的值,这个节…

[Python工匠]输出②数值与字符串

2.1 基础知识 2.1.1 数值基础 在Python中,一共存在三种内置数值类型:整型(int)、浮点型(float)和复数类型(complex)。 在大多数情况下,我们只需要用到前两种类型&#x…

SAR ADC系列23:异步SAR逻辑

异步sar逻辑的引入: 原因1:提高转换速度 ■ 同步时钟从第一个比较周期到最后一个比较周期长度都是相等的。对于Latch比较器,信号幅度越小,比较时间越长(参考latch时域响应那一节)。为了保证比较器…

Linux串口出厂测试工具与使用说明

1、说明 本文针对Linux系统上如何对各类串口硬件进行出厂测试进行硬件连接和软件使用说明,提供的软件测试工具wchsertest,适用于USB、PCI、PCIe转串口设备等、同样也适用于原生ttyS串口。 2、串口测试硬件连接 在测试前,需要制作单独的硬件…

寸照换底色技巧大全,超详细图文教程

在日常的设计工作中,我们常常需要将图片的背景色进行修改,以适应不同的场景和需求。其中最常用的方法就是寸照换底色技巧。本文将为大家介绍一些常见的寸照换底色技巧,并提供超详细的图文教程,帮助大家轻松完成这项任务。 一、使…

2023最新面试题-Java-6

1. Date API Java 8 在包java.time下包含了一组全新的时间日期API。新的日期API和开源的Joda-Time库差不多,但 又不完全一样,下面的例子展示了这组新API里最重要的一些部分: Clock类提供了访问当前日期和时间的方法,Clock是时区敏…

springboot加载命令行参数ApplicationArguments

往期文章 springcloud整合knike4j聚合微服务接口文档 spring源码 - 条件注解ConditionnalOnClass的原理分析 springboot项目实现导出pdf功能,这也太简单了吧 目录 文章目录往期文章目录一、介绍二、通过应用程序参数获取配置1. 通过bean获取应用程序参数2. 通过V…

在外web浏览器远程访问jupyter notebook服务器

文章目录前言视频教程1. Python环境安装2. Jupyter 安装3. 启动Jupyter Notebook4. 远程访问4.1 安装配置cpolar内网穿透4.2 创建隧道映射本地端口5. 固定公网地址转载自远控源码文章:公网远程访问jupyter notebook【cpolar内网穿透】 前言 Jupyter Notebook&#…

我现在必须new一个对象!!!

目录 前言 1.new 2.delete 3.底层逻辑 4.定位new 5.对比 前言 🎃之前在使用C语言的时候,我们便使用 malloc 和 calloc 等函数进行动态内存的开辟。但 C 之中又引入了两个操作符 new 和 delete 来代替C语言中的函数进行动态内存的管理。下面就一起…

苏州源特VPT87DDF01B 隔离变压器 小体积/SMD/3000VDC 隔离

1 产品特点  小体积隔离变压器  隔离电压 3000VDC  工作温度:-40~125℃(包含产品温升)  存储温度:-55~125℃  SMD 表贴安装  回流焊温度:峰值温度≤250℃(10s)  回流焊次数&#…

Softing新版HART多路复用器软件支持西门子控制器

用于访问配置和诊断数据的HART多路复用器软件——Softing smartLink SW-HT,现在支持西门子的ET200远程IO和FDT/DTM接口。 smartLink SW-HT是一个基于Docker容器的软件应用。通过该软件,用户可以快速地访问以太网远程IO的HART设备,并且无需额外…

【Linux】进程间通信之管道(pipe)

文章目录前言为什么要进程间通信进程间通信的理论依据管道管道的原理创建匿名管道管道的特点管道的场景利用管道控制子进程命名管道命名管道的打开规则命名管道和匿名管道的区别用命名管道实现server和client通信前言 大家好久不见,今天开始我们将进入进程间通信章…

redis高可用方案:主从复制+哨兵模式,经典案例:一主二从三哨兵,及springboot集成配置

Redis高可用方案:主从复制哨兵模式 经典案例:一主二从三哨兵,及springboot集成配置 第一.配置 1.主节点配置(redis.conf) # 主节点配置 仅展示必要配置 redis.conf # 保护模式设置为关,方便其他节点访问…

推荐几款炫酷的 MySQL 可视化管理工具!好用到爆!!

MySQL 的管理维护工具非常多,除了系统自带的命令行管理工具之外,还有许多其他的图形化管理工具,工具好用是一方面,个人的使用习惯也很重要,这里介绍 13 款 MySQL 图形化管理工具,供大家参考。 1&#xff1a…

vite .env.test环境使用ant design vue ,打包后a-date-picker控件无法选择日期

前端开发后台管理系统,常用的UI库当属Element UI和 Ant Design Vue,但是前段时间遇到一个奇葩问题,在这里记录一下,防止小伙伴们踩坑。 后台系统,大家肯定都用过时间控件,本期我们使用的是ant design vue&…

2道关于chan的面试题

题目一: 下面关于通道描述正确的是: 1.读nil chan会触发panic 2.写nil chan会触发panic 3.读关闭的chan会触发panic 4.写关闭的chan会触发panic解答:这个提涉及到2个知识点,操作nil的chan会怎么样,操作关闭的chan会怎么样,下面我…

双目相机测距原理

双目相机测距是一种常用的计算机视觉技术,它利用两个摄像头同时拍摄同一场景,通过测量两个摄像头视野中同一物体在图像上的像素差异,从而计算出物体距离的方法。 具体原理如下: 双目相机的构成 双目相机由两个摄像头组成&#…

用ChatGPT怎么赚钱?普通人用这5个方法也能赚到生活费

ChatGPT在互联网火得一塌糊涂,因为它可以帮很多人解决问题。比如:帮编辑人员写文章,还可以替代程序员写代码,帮策划人员写文案策划等等。ChatGPT这么厉害,能否用它来赚钱呢?今天和大家分享用ChatGPT赚钱的5…

Cesium关于3Dtiles的细节分享

介绍 介绍一下Cesium中有关3dTiles的奇淫技巧,存在一些埋坑的地方,以下内容仅为自己摸索的细节和方法,仅供参考,若有更好的办法欢迎讨论 通用快速获取feature中包含的属性信息 有时候需要快速获得3dTiles中的feature中的属性信…