构建新摩尔定律下的算力分发网络

news2024/9/29 23:39:00

摩尔定律最早由英特尔创始人之一戈登·摩尔在1965年提出,他认为集成电路上可以容纳的晶体管数目在大约每经过18到24个月便会增加一倍。20年后的今天,面对日新月异的社会和突飞猛进的数字化需求,摩尔定律也随着社会的进步而被赋予了新的定义。LiveVideoStackCon 2022北京站邀请到了网心科技CEO李浩为我们分享了如何构建新摩尔定律下的算力分发网络。

文/李浩

编辑/LiveVideoStack

我今天演讲的主题是《构建新摩尔定律下的算力分发网络》

b7a939da206cb7525a96771b8a0323d0.jpeg

1.算力奇点及对音视频内容的影响

38d5c4a184228ad5917f8cbeb6bb36d9.jpeg

狭义的摩尔定律是指芯片、晶元和密度。现在,万物皆可摩尔定律。Sam Altman在推特上发表了一个颇具争议的话题——宇宙智能体会以18个月为周期翻倍。我个人对宇宙智能体的理解就是AI算力。右边的图是知名社会学家雷库兹韦尔在2005年出版一本书上的插图。该时间点出奇的吻合。2020年左右相当于一只老鼠的智商,而现在GPT-4的连接数在1万亿左右。人类的神经元连接数大约170万亿。1万亿是啮齿类动物的水平,典型的代表就是松鼠。按照摩尔定律GPT-4 用20年的时间就可以达到人类的水平。但如果按照GPT-3.5到GPT-4的速度来算,只需要2年的时间。没有人清楚真正到达170万亿以后会引起什么样的社会改变。现在,我们正处在一个巨大的历史变革时间点。

e90e4486d887baebfb920b29cb3db0b8.jpeg

大模型有一个比例定律,其增长符合对数曲线。模型参数指数级增长,模型性能线性增长。因为这样的思维,我们还认为模型在行为智能性上达到人类水平还很遥远。

但当超过10billion以后,学者发现了有快速增长的相变曲线,出现了涌现能力。我认为这应该是OpenAI公司对人类最大的贡献,它证实了迭代大模型道路的可行性。模型越大,性能提升的速度越快。

7180d24ca2f0ba6e5f9853de652e3792.jpeg

下面简单介绍一下云计算行业。2010年左右云计算刚开始的时候,团队探讨过远景,我们认为云计算会分为以下三个阶段:

第一个阶段是资源维度,需要自己掌握机器、掌握DB、掌握网络以及掌握存储等,自己搭建出自己的服务。

第二个阶段是无服务化阶段,只需要用代码调度即可,更加面向开发者。当网络和服务都成熟以后,会进入到第三个阶段,面向使用者。

但第三个阶段形态较为复杂,使用困难,一直没有讨论出结果。但当大模型出现以后,一切都变得迎刃而解,自然语言就是最好的办法。当模型很好地理解自然语言时,算力调度逻辑就会变得平民化。这将对整个云计算行业来说都是一个巨大的突破。

137d6913a901ba1f5a5d797073608a2e.jpeg

对于音视频行业而言,不管是智能配音还是生成AI宣讲视频,现在自己完全可以构想出创意和文案,通过再现和智能配音,最后再生成一些视频,一整套下来仅需要半天时间。相比之前需要一整个团队做一个星期,现在非专业人士半天的时间就可以完成,生产力可以得到大幅提升。

对于传统的音视频内容,其在终端产生,在云端处理后分发给其他观众。中间的过程简单明了。在有了AGI以后,整体需要加工的内容变多。假设很多人在看《狂飙》,那么电视剧在分发给我的过程中,会根据我的喜好进行了一些改变,那么其算力的提升是不可避免的。数据的产生在边缘侧和云端会更多,这也导致内容生产分发源头出现了变化。

c11b2f6a5cdb33c7bd05acb3a2da82fd.jpeg

左边的图是IDC在2020年的预测,但我认为其数据较为保守,2025年绝大多数的数据都将储存在核心和边缘,远超于80%。以后一定会出现新的机会,对于个人数据节点,人工智能出现以后,会加速社会的数字化,个人数据将会成为最大的隐私财产。

2.边缘云成为新数据源头及引发架构变革

9ff89e8503faf84b6b4999095a25cbbc.jpeg

我认为边缘云会成为新的数据源头,同时也会引发新一轮的架构变革。数据运算需求的提升,运算将很难在终端完成,只能在边缘端和云端完成。随着需求增大,边缘端速度快、成本低,一定是云端很好的补充。云和边一起构建了泛化的云计算网络,未来将会承担大部分的数据生成和数据计算。而用户只需要很小的样本,即可生成个性化数据,一些本地化的工具也一定要云端化。目前包括Adobe等公司也已经开始着手去做了。

ba0eb862427fc41542338c47a37a89b8.jpeg

机会和挑战总是并存的。从技术角度出发,传统的网络结构中,可以像快递包裹一样分地很小很细,差异化不大。但是一旦叠加上算力,差异化就会非常大。GPT-4的参数量可以在6000到10000亿之间,需要一个多T的显存才可以加载,而一些小模型,几个G就可以加载。一些东西不可以原子分割,会导致分布变得复杂,需要根据需求调整分割。这里引用艾瑞咨询的报告来展开算力网络的三大要素。

算力网络有三大组成要素:

(1)计算:算力网络的核心资源。

(2)感知:对具体场景算力需求的感知及算力资源的感知。

(3)连接:将分散、异构、多层级、闲置的算力集合起来。

以上三大要素赋予算力网络功能属性和服务属性,让其能高效盘活全社会算力资源,并赋能产业应用。从算力网络的技术架构上看,从下到上可分为基础资源层、算网调度层和算网运营层,同时算网运维和算网安全贯穿全程,形成“三横两纵”的支撑形态。最终,算力网络会以产品或能力的形式,赋能产业应用。

5eeb5137371e5c02dbb7a25b93983dc8.jpeg

未来,在边缘侧会有大量的内容生产过程。只需要叠加一些源数据,包括数字人、特效等都可以在边缘侧生成。下发的图片因为有强延时的需求,只能在边缘侧生成。

b3ea6768de13e8fe155777b35f2b4434.jpeg

其次,实时交互也会更多。很多本地化的交互都会变成和云端的交互。目前云端交互最苛刻的应该是RTC场景视频对话。下一个潜在场景是云游戏。云游戏的交互所需要的延迟仅为视频的一半,不能超过100ms,再之后是10ms以内的虚拟现实等。随着演变,对网络分发算力的稳定性的要求会越来越苛刻,边缘侧分发必须具备超低延迟的能力。

e6aededcf10b3f74e8550863947bf7d1.jpeg

最后,业务逻辑也会增多。一旦数据源头发生变革,所有数据逻辑都需要重写。这和云计算最大的区别是不能以资源维度调动边缘,这样会过于复杂。所以边缘侧一定要以服务化为核心,要建立在Severless基础上重构业务逻辑。

3.网心音视频服务架构演进

网心针对上述提到的种种问题,做了很多的尝试。我们也推出了基于未来算力,为服务好音视频客户的产品。所以,我们的价值更加聚焦于如何给客户提供更低延时,更优、更便宜的算力,更加便捷的操作的服务。

先简单介绍一下网心科技。网心科技是国内最早做云计算的公司,也是全球最大、最下沉的边缘网络运营商。网心的理念是边缘云计算一定是一个平台模型。无论是自建、共建、合建,都要多层级碎片化的资源进行高效的整合,同时做到技术上的分装,让对外的接口标准化,服务好产业中的客户。现在网心主要的服务对象是音视频行业头部公司,同时也在AI、超低延时等场景中布局。现在网心的边缘节点数量规模已超过500万,通过自己的SDK覆盖了超过6亿的中国用户。

首先,看一下我们利用边缘闲置的主机构建的云游戏体验,整体的画面体验以及延时完全可以满足游玩的需求。

b3880f5540ea43cea2ec532ac4b00e6c.jpeg

相比传统厂商,网心的云游戏架构最大的区别在于采用的是边缘侧的节点,覆盖密度更高。如果用中心云去做云游戏不仅成本不可控,延时也非常高,实现不了低于70ms的体验。通过构建的边缘网络,找到距离用户最近的节点将渲染和串流的体验做到最优。

网心提出了几个技术创新点。第一个是边缘网络独有的,正因为具有海量的边缘节点,所以可以非常清晰地感知到网络的状态,这是很多云计算厂商难以做到的。第二,所有的端到端协议都是网心自己做的。现在的RTC行业核心要解决双端交互的问题,但是云游戏是单端超低延时交互,高码率、高帧率、低延时是云游戏的三个基础特征。网心通过使用QUIC协议,将数据面和控制面分离。在应对高码率、高帧率、超低延时也引入新的拥塞控制和RS FEC等技术。

基于上述创新技术,我们看到在可用带宽快速恢复上,在出现网络大丢包情况下500ms就可以恢复到理想的数值。弱网表现的测试结果显示,OT QUIC 丢包最优,延时优于indigo。

我们再来看下AIGC文本生成图片场景。边缘主要以小算力为主,这类的小模型非常适合在边缘跑,并且其单任务、少交互的方式更加契合边缘的算法。

659c97b05adcff2815e396b23e232660.jpeg

AIGC IAAS架构整体变化不大。网心已经可以构建出完善的边缘网络虚拟GPU容器。一些容器较大,需要切开,而另一些较小的则不需要切开。归根到底还是使用图片生成式的服务调动共有的边缘节点,这样做可以极大地节省成本。

为了使边缘云计算更好的应对未来的场景,网心科技提出了“三步走”发展策略:

第一步,降本增效。目前立足于能产生经济收益的场景以及客户的实际需求,利用客户扩大网络规模,提升网络水平,降低成本,提高效率,推助企业良性扩张。

第二步,功能迭代。逐渐丰富业务场景,推助云游戏、AIGC等业务的完善与推广;坚持对算力类需求的研发与覆盖;持续提升算力布局和能力。

第三步,构建生态。推动边缘网络和算力叠加,对接产业场景并实现产业场景产品化;以车联网、车路协同为切入点,适配消费类客户需求;构建开放网络平台,吸引开发者、合作伙伴共同构建生态。

我们有信心在未来8到10年里逐步实现三步走的规划。今年AGI的快速发展,很有可能会将需要的时间大幅压缩。

这是我今天的分享,谢谢大家。


7987e52933f06f1511f180c54a84bc5f.jpeg

LiveVideoStackCon 2023上海讲师招募中

LiveVideoStackCon是每个人的舞台,如果你在团队、公司中独当一面,在某一领域或技术拥有多年实践,并热衷于技术交流,欢迎申请成为LiveVideoStackCon的讲师。请提交演讲内容至邮箱:speaker@livevideostack.com。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/429365.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第八章 法律关系

目录 第一节 法律关系的概念 一、法律关系的定义与特征 二、法律关系的种类 (一)纵向(隶属)的法律关系和横向(平权)的法律关系 (二)单向(单务)法律关系、双…

基于ITIL搭建公司IT治理服务框架

ITIL帮助组织标准化其IT服务和流程。ITIL文档包括各种政策、程序和指南,帮助IT团队向客户提供优质的服务。 根据ITIL框架的五个阶段,ITIL文档被广泛分类为不同的类别。 这些阶段包括服务战略、服务设计、服务过渡、服务操作和持续服务改进。每个类别都有…

android内存泄漏检测,Android内存泄露检测之LeakCanary的使用

为了能够简单迅速的发现内存泄漏,Square公司基于MAT开源了LeakCanary。使用LeakCanary,在内存泄漏后,通过分析引用链可以分析内存泄漏的原因,LeakCanary用于检测Activity、Fragment的内存泄漏。 下面通过一些实际案例来进行分析。…

如何替换spring boot中spring框架的版本

背景 我开源的一个项目中,有朋友提到存在Spring Framework 身份认证绕过漏洞(CVE-2023-20860)。 解决方案是升级spring 框架版本: Spring Framework 5.3.X 系列用户建议升级Spring Framework到5.3.26及以上安全版本修复该漏洞Spring Framework 6.0.X 系…

HashMap 学习笔记

HashMap: 为什么经常深入考察? 基于java写的代码会访问很多东西,比如数据库,缓存,消息中间件。 HashMap数据结构 底层是数组 原本已经有很多个位置了 原本是取模但是优化成了性能更高的hash&(n-1) 让哈希值…

【性能测试】5年测试老鸟,总结性能测试基础到指标,进阶性能测试专项......

目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 性能测试是为了评估…

java 接口,接口的特性,接口实现多态,面向接口编程

package cn.zy.cellphone; /**接口是一种引用数据类型。使用interface声明接口,形式* 形式:public interface 接口名称{}* 接口不能拥有构造方法,不能用于创建对象*接口可以多继承。一个接口可以继承多个其他接口*列如:public interface Broa…

任何人都可以学习车载测试吗?车载测试有什么门槛?

1、车载测试是什么? 车载测试分很多种,有软件测试、硬件测试、性能测试、功能测试等等,每一项测试的内容都不一样,我们所说的车载测试主要指的是汽车软件的功能测试,也就是针对汽车实现的某一个功能,而进行…

windows平台多版本nodejs共存工具nvm-windows 中文文档

2023年4月14日11:11:49 官网地址:https://github.com/coreybutler/nvm-windows 下载地址:https://github.com/coreybutler/nvm-windows/releases nodejs版本列表 https://nodejs.org/en/download/releases PS C:\Users\pc\Desktop> nvm -h Running ve…

关于测试,我发现了哪些新大陆

关于测试 平常也只是听说过一些关于测试的术语,但并没有使用过测试工具。偶然看到编程老师在课堂上使用龙测为我们展示了一波测试的相关操作,我发现了一些新大陆,这篇文章就记录一下有关测试的相关操作。 开启测试之旅 进入官网了解到 龙测…

java学习之接口二

目录 一、接口vs继承 一、继承 二、接口 二、接口多态特性 一、多态参数 二、多态数组 三、多态传递 三、接口练习 一、接口vs继承 一、继承 package com.hspedu.interface_;public class ExtendsVsInterface {public static void main(String[] args) {LittleMonkey…

5G物理层信道pdcch说明(留档)

网络七层协议OSI是一个开放性的通信系统互连参考模型。 它是国际标准组织制定的一个指导信息互联、互通和写作的网络规范。 开放:是指只要遵循OSI标准,位于世界的任何地方的任何系统之间都可以进行通讯;开放系统:是指遵循互联网协…

【结构型模式】装饰者模式

文章目录优秀借鉴1、概述2、结构3、实现方式3.1、案例引入3.2、实现步骤3.3、案例实现4、装饰者模式优缺点5、结构型模式对比5.1、装饰者模式和代理模式5.2、装饰者模式和适配器模式6、应用场景优秀借鉴 装饰模式 — Graphic Design Patterns设计模式 | 装饰者模式及典型应用黑…

基于图卷积神经网络GCN的二部图链路预测方法实现思路和完整代码【可用于疾病-靶点、miRNA-疾病等相关预测】

本文解决的问题 基本假设:二部图只有邻接矩阵,没有节点特征,并且进行链路预测,有部分链路未知。 如果你有初始节点特征,直接换掉即可 实现思路 这段代码主要是用于构建一个基于图卷积神经网络(GCN&#…

内网域渗透总结(红日靶场一)

一、靶场环境搭建 红日靶场:http://vulnstack.qiyuanxuetang.net/vuln/detail/2/靶机通用密码:hongrisec2019win7win2003win2008 这个搭建靶场的过程是我经过实际操作(踩坑)总结的最简单省事的方式。 首先创建一个仅主机模式的…

使用appuploader工具发布证书和描述性文件教程

使用APPuploader工具发布证书和描述性文件教程 之前用AppCan平台开发了一个应用,平台可以同时生成安卓版和苹果版,想着也把这应用上架到App Store试试,于是找同学借了个苹果开发者账号,但没那么简单,还要用到Mac电脑的…

数据结构之图(最小生成树+最短路径)

基本概念 连通:若a->b存在路径,即为连通 连通图:该图中任意两点均连通,即为连通图 连通分量:下图为无向图,但存在三个连通分量 强连通图:双向的连通图 强连通分量:有向图中的双…

分享一个免梯子智能的问答工具ChatGPT,刷题和学习的好帮手

使用了这个问答工具后,感觉前后端都要被替代了,太强了。 由于本人之前很想体验,但是一直难搞,最近发现了一个免梯子的,重要事情说一遍,免梯子!是我最近发现的最好用,最快的,且不要梯子的,用起来爽,界面也挺好看的,大家快玩儿玩儿。 试了一下写代码,写文案……真棒…

文心一言 VS chatgpt (9)-- 算法导论2.3 7题 3.1 1题

七、描述一个运行时间为O(nlgn)的算法,给定n个整数的集合S和另一个整数,该算法能确定 S中是否存在两个其和刚好为工的元素。 文心一言: 这里是一个运行时间为O(nlgn)的算法,可以用来确定集合 S 中是否存在两个元素,它…

FE_CSS 页面布局之定位

1 为什么需要定位 某个元素可以自由的在一个盒子内移动位置,并且压住其他盒子。 当我们滚动窗口的时候,盒子是固定屏幕某个位置的。 以上效果,标准流或浮动都无法快速实现,此时需要定位来实现。 浮动可以让多个块级盒子一行没有…