过去十五年,是云计算从无到有突飞猛进的十五年。PaaS 作为云计算的重要组成部分,在伴随着云计算高速发展的同时,在云计算产业链中的关键性作用日渐凸显。关于 PaaS,很多人都认同一个观点,在公有云上,除了 IaaS 和 SaaS,其余的都是 PaaS。但 PaaS 到底是什么?它从哪里来,将到哪里去?PaaS 有哪些细分领域?哪些厂商是 PaaS 市场领导者?PaaS 和现在流行的容器管理平台、企业中台和低代码平台之间的关系又是什么?这些问题的答案,向来是众说纷纭、莫衷一是。要回答这些问题,且听笔者为您娓娓道来。
PaaS 是什么
(一)宏观上,PaaS 是处于 IaaS 和 SaaS之间的平台层。
PaaS,Platform as a Service,平台即服务。它是一种云计算服务,向使用者提供云上应用程序所需的编程语言、库、服务、工具和解决方案。使用者无需管理或控制底层云基础设施(包括网络、服务器、操作系统或存储),但需管理已部署的应用程序,并负责配置应用程序托管环境。在云计算的典型层级中,PaaS 层介于 IaaS 层和 SaaS 层之间。
图1 PaaS 层介于 IaaS 层和 SaaS 层之间
值得一提的是,Gartner 将容器归为 IaaS 层。Gartner 将虚拟机类 IaaS 服务称为 Cloud Compute Infrastructure Services (Instance IaaS),比如 Amazon EC2,Alibaba ECS 等;将容器管理类 IaaS 服务称为 Cloud Container Management Infrastructure Services (cIaaS),比如 Amazon Elastic Container Service (ECS),Amazon Elastic Container Service for Kubernetes (EKS),以及 Google Kubernetes Engine 等。
(二)具体上,Gartner 将 PaaS 分为22个子类。
Gartner在其《Platform as a Service: Definition, Taxonomy and Vendor Landscape》报告中,收集了来自全球超过360家供应商的22类 PaaS 产品和服务。下表按 PaaS 名称排序。
表1 Gartner对PaaS的分类
笔者要对上表中的 aPaaS 做下特别说明。aPaaS,Cloud Application Platform Service,Gartner 对它的定义是:云上应用的开发、部署和运行平台,并将其分为两类:
一类是高控制(High-control)aPaaS,也叫 pro-code aPaaS。这类 aPaaS 平台向 IT 专业开发人员提供传统编程环境。目前,绝大多数的提供商提供的是这类平台,包括Amazon Elastic Beanstalk、Salesforce Heroku、Red Hat OpenShift 等。
另一类是高生产率(High-productivity)aPaaS,也叫 low-code 和 no-code aPaaS。这类 aPaaS 平台向业务人员和平民开发人员提供低代码或零代码开发环境。典型产品如 Mendix、OutSystems。
不得不说,虽然表1非常有助于我们了解市场上有哪些 PaaS 服务,但其分类也实在是太细了,这也说明目前 PaaS 市场的碎片化特征比较明显。笔者试图将这22种 PaaS 服务分为三大类,见表2。笔者把 Gartner 定义的 aPaaS 看作狭义 aPaaS,而表2中的广义 aPaaS 包含了更多的内容。
表2 PaaS 服务大类
严格来说,所有 PaaS 服务都是面向开发者和应用的,因此表2中的分类可能不是非常准确,但这三大类 PaaS 服务间还是有所区别的:应用类 PaaS 服务(广义 aPaaS)是云上应用开发平台及相关组件,数据类 PaaS 服务更多的是向业务提供数据分析和智能能力,其它 PaaS 服务则是在特定领域提供平台式服务。本文后续提到的 aPaaS,都指的是广义 aPaaS。
(三)从企业视角来看,PaaS 又可分为技术 PaaS 和业务 PaaS。
图2 企业级 PaaS
现在 IT 发展水平较先进的企业中,基于技术性 PaaS 平台,往往会构建企业技术中台;基于技术中台,又会构建企业级业务性 PaaS 平台,包括业务中台和数据中台。业务中台提供可共享复用的业务能力,数据中台提供可共享服务的数据服务。
因此,可以认为,企业级 PaaS 平台由技术性 PaaS 平台和业务性 PaaS 平台构成,企业中台和企业 PaaS 大体上是同一个概念,或者说两者高度重合。
PaaS 的发展简史
PaaS 的发展史,用两句话就可高度概况:PaaS 的发展与云计算的发展相伴相随;aPaaS 代表了 PaaS 过去这十五年。因此,过去往往把 aPaaS 和 PaaS 这两概念画等号。
2006年,Amazon Web Services(中文名:亚马逊云科技)正式推出并商业化,这被视为公有云的发端。2007年,Salesforce 发布 force.com,其目的是支持第三方客户在其上开发、部署和管理应用,这被视为公有云PaaS的发端。此后,同类平台如雨后春笋般发展起来,Google在2008年发布 GAE,新浪在2009年发布 SAE。2010年,Heroku 被 Salesfore 收购。2011年,亚马逊云科技发布 Beanstalk 平台,红帽发布 OpenShift 平台,VMware 发布 CloudFoundry。2015年,IBM 开始构建 Bluemix 平台。2016年起,国内 PaaS 平台建设加速。阿里巴巴、华为等科技巨头开始发力公有云 PaaS,一批初创型 PaaS 服务公司涌现在市场中。
根据《赛迪顾问:2021 2022年中国 PaaS 市场研究年度报告》,aPaaS 在整体 PaaS 场中应用最多。aPaaS 能够为应用开发和运行提供丰富的组件和环境,帮助企业快速构建应用、智能化管理应用,2021年全球 aPaaS 在整体 PaaS 市场中的应用最多,占比为38.3%。
图3 2021年全球 PaaS 市场产品结构(来源:赛迪顾问)
厂商方面,亚马逊云科技是全球 PaaS 市场第一大厂商,微软和 Salesfore 紧随其后。Amazon 作为全球云服务领域的头部厂商,利用其在全球的26个地理区域中的84个可用区和300多个边缘节点,能够为全球大部分的国家和地区提供全面的 PaaS 服务,占全球 PaaS 市场规模的18.7%。
表3 2021年全球 PaaS 市场厂商 TOP3(来源:赛迪顾问)
在国内 PaaS 市场,公有云占比高超过60%,阿里云、亚马逊云科技、华为云、腾讯云等公有云巨头处于领导者象限。
图4 2021年中国 PaaS 市场厂商竞争力象限分析图(来源:赛迪顾问)
PaaS 再升级
接下来要阐述的 PaaS 当下这次再升级,也可用两句话高度概况:aPaaS 日臻成熟,新兴低代码平台崛起,iPaaS 将迎来新发展机会;数据类 PaaS 将异军突起,将对 aPaaS 形成赶超。下面从这两个方面来分别介绍。
(一)aPaaS 日臻成熟,三个趋势凸显。
在笔者看来,经过近15年的发展,传统的面向专业开发者的 aPaaS 平台已日臻成熟,使用也非常普及。从 Gartner 的 PaaS 炒作曲线中也可以看出,aPaaS 目前已处于发展成熟期。
图5 2021年 PaaS 炒作曲线(来源:Gartner)
当然,这不是说 aPaaS 已到天花板而将不再发展。笔者认为 aPaaS 接下来有三个主要发展趋势:
一是云开发平台的云原生化。
应用的云原生化必然要求 aPaaS 平台云原生化。如图6所示,Gartner 预测,云原生 PaaS 平台将具有四个特点:微服务、持续发布、无服务化和多重体验。Gartner 预计,到2025年,云原生平台将成为超过95%的新兴企业的基础应用平台,而2021年这一比例还不到40%。
图6 云原生 PaaS 平台的四大特征(来源:Gartner)
二是开发平台的低代码化。低代码开发平台(LCAP)兴起,有望成为 aPaaS 的一大分支。
低代码开发平台(LCDP)是无需编码或通过少量代码就可以快速生成应用程序的开发平台。通过可视化应用程序开发的方法,使具有不同经验水平的开发人员可以通过图形化的用户界面,使用拖拽组件和模型驱动的逻辑来创建网页和移动应用程序。
2014年,研究机构 Forrester 正式提出了“低代码”概念,Gartner 随后用基于 aPaaS 的高生产力平台(hpaPaaS)来命名这一品类,Microsoft、Mendix 等深耕低代码头部企业也逐步入局。笔者认为,hpaPaaS 属于狭义a PaaS 领域中的一个新兴分支,是一种云上应用新型开发、部署和运行平台。
在笔者看来,随着软件人力成本持续上升,以及企业数字化转型带来的需求量大幅增加,低代码平台的价值将逐步显现,应用也会越来越广泛。它的出现改变了现有应用开发模式,能增加广义开发人员的数量,应用交付速度得以加快,企业 IT 活动得以降本增效。
Gartner 预测,到2025年,企业开发的新应用程序中有70%将使用低代码或无代码技术,而2020年这比率还不到25%。
笔者认为,这种新型aPaaS平台一定未来可期。虽然Gartner的炒作曲线中,LCAP 已经处于成熟期,但笔者在调研国内市场十余家低代码平台后还是认为其目前仍然处于发展早期,产品成熟度有待进一步提升。笔者期待各大公有云上低代码平台的地位得以提升。低代码开发平台必将成为公有云 PaaS 平台的重要组成部分。
三是 iPaaS 的重要性将会进一步提升。
iPaaS 用于企业级集成。过去,ESB(Enterprise Service Bus,企业服务总线)承担了企业服务整合的职能。如今的多云和混合云时代,企业集成需求更加丰富,如应用与应用之间的集成、企业和企业之间的数据交换、公有云到私有云以及多云之间的协同、设备到设备之间的集成,还有企业和生态合作伙伴之间的对接等。这些都将持续提升iPaaS的重要性。
(二)数据类 PaaS 服务是哪些?
一类是云数据库服务,包括关系型数据库和非关系型数据库,统称为 dbPaaS。
以亚马逊云科技为例,其提供了如图7所示的八大类十余种数据库服务。
图7 亚马逊云科技八大类数据库服务(来源:亚马逊云科技)
第二类是数据分析服务,统称为 abiPaaS。
如图8所示,亚马逊云科技提供了交互式查询、大数据处理、日志分析和搜索分析、实时分析、数据仓库和可视化等数据分析类服务。其中,Amazon EMR 用于大规模数据处理,支持Hadoop、Spark等开源处理项目。Amazon MSK 用于实时分析。Amazon Kinesis 用于实时数据流收集。Amazon OpenSearch Service是一个基于开源搜索引擎 OpenSearch 的日志分析与搜索分析工具。Amazon QuickSight 用于数据可视化。Amazon Athena 使用标准 SQL 即时分析存储在 S3 中的数据。Redshift 数据仓库服务,可以对 PB 甚至 EB 级结构化数据集合执行复杂查询。
图8 亚马逊云科技数据分析服务(来源:亚马逊云科技)
第三类是人工智能即服务,称为 AI PaaS。
目前,各大公有云都提供了品类丰富的 AI 服务。亚马逊云科技将其服务分为人工智能(AI)服务和机器学习(ML)服务。其中,AI 服务比如文本、图像、视频等处理类服务;ML 服务主要是 Amazon Sagemaker 人工智能平台服务。
图9 亚马逊云科技人工智能服务家族(来源:亚马逊云科技)
把这三大类数据服务合并,加上区块链服务,就是图10的样子。这些服务构成了公有云数据类 PaaS 服务可能是最齐全的大家族。
图10 亚马逊云科技数据类 PaaS 服务家族(来源:亚马逊云科技)
云数据库类服务大家都比较熟悉,无需赘述。数据分析类服务和人工智能服务,两者之间是什么样的关系呢?实际上,两者之间不是孤立的,而是存在紧密的联系。主要有两种关系:
一种是数据分析服务于人工智能。
此类场景中,数据分析服务对源数据进行收集、筛选和清洗,并将处理后的数据作为人工智能服务的训练数据,最后产生推荐模型和部署为推荐服务。这种关系比较常见。
图11 数据分析服务于人工智能(来源:亚马逊云科技)
另一种是人工智能服务于数据分析。
亚马逊云科技多数数据分析服务都集成了人工智能服务,比如 Redshift ML、Athena ML、Quicksight ML 等服务。以发布于2021年5月的 Amazon Redshift ML 服务为例,它利用 Amazon SageMaker 服务,让用户能够用SQL命令创建、训练、部署和使用机器学习(ML)模型。
图12 Amazon Redshift ML 服务(来源:亚马逊云科技)
如上图所示,数据进入 Redshift 数仓以后,用户可直接在SQL语句中使用‘create model’命令来创建机器学习模型。然后,Amazon Sagemaker 自动创建和训练出 ML 模型并进行部署,然后用户可以使用 SQL 语句来进行预测性查询。
(三)为什么未来数据类 PaaS 将异军突起甚至超越 aPaaS?
在赛迪顾问的“2021年全球 PaaS 市场产品结构”图(图3)中,上述三种数据类 PaaS 分别被称为 DBPaaS、BDPaaS 和 AIPaaS。从全球份额上看,三者的份额加起来都没有 aPaaS多。那为什么笔者还认为未来数据类 PaaS 将异军突起甚至超越 aPaaS 呢?笔者认为主要原因有三:
1.先做应用建设,再增加数据服务,是几十年来的普遍IT规律。
过去还没有出现云服务的年代,应用都是传统式的。企业往往是先自己开发或购买应用,随后开始支撑业务。随着时间的推移,用户越来越多,数据库中就有了越来越多的数据。此时,企业往往会购买专业的数据分析类软件用于数据分析,主要是制作各种报表。但这种数据分析软件,往往都庞大而笨重,价格动辄千万级别,成本非常高,还需要专人维护。
有了公有云服务后,企业首先利用到云上各种服务快速构建起应用。此时通常会利用云关系型数据库,因为这是最容易的事情。应用投产后,用户和产品越来越多,数据库中留存的数据也越来越多。此时,企业想知道“我的客户满意度如何?销量季度环比如何?”,就会对应用增加数据分析和可视化功能。企业还想知道“下季度我企业的新产品销量会如何?”,就会利用人工智能服务进行预测。现在,用更少的钱,以很小的起点,就可以获取之前上千万美金才能获取的能力,这就是公有云上的优势。
图13 三段式数据利用旅程(来源:Amazon re:Invent 2021)
因此,不论是过去还是当下,先搭建应用并留存下数据,再做数据分析和可视化,直到利用人工智能进行预测,这是 IT 业务的基本旅程。aPaaS 的主要使命是为了开发者更便捷地搭建、发布和运行应用,而各种数据类 PaaS 则服务于数据分析和智能预测。
2.业务持续数字化转型,数据量越来越大,对数据服务的要求越来越多、越来越高。
业务数字化的核心是数据驱动。业务数字化,带来数据量指数型增长,企业对数据存储和计算分析的能力要求不断提升。
一方面,云关系型数据库高速发展。云上数据库性能和便捷性越来越高,而成本却越来越低。以 Amazon Aurora 为例,它是与 MySQL 和 PostgreSQL 兼容的关系数据库。性能和可用性与商用数据库相当,成本只有其 1/10,还大大减轻运维负担,节省运维成本。
另一方面,由于大数据、物联网、机器学习等应用场景的兴起,非关系型数据的数据量和处理需求增长速度高。Gartner 数据显示,2021年非关系型数据库的市场收入达到148亿美元,占总体数据库市场的19%。2017年时,这一比例仅为8%。
从图14可以看出,云上数据库在整个数据库市场的比例逐年快速上升。本地数据库和云上数据库的市场份额已经非常接近,到2021年,已经达到49%。按此趋势,今年(2022年)云数据库将首次超过本地数据库。
图14 2017到2021年本地和云数据市场份额
3.业务持续数字化转型,新一代数字应用的出现,激发了数据类 PaaS 服务的需求。
《数字化转型知识方法系列之一:数字化转型的基本认识与参考架构》一文指出,数字化转型是顺应新一轮科技革命和产业变革趋势,不断深化应用云计算、大数据、物联网、人工智能、区块链等新一代信息技术,激发数据要素创新驱动潜能,打造提升信息时代生存和发展能力,加速业务优化升级和创新转型,改造提升传统动能,培育发展新动能,创造、传递并获取新价值,实现转型升级和创新发展的过程。
新一代企业级数字应用的加速迭代和创新,将充分释放 PaaS 的价值并增加对 PaaS 的需求,尤其是将带动 AIPaaS、IoTPaaS、bPaaS 等数据类 PaaS 服务在整个 PaaS 市场的份额进一步扩大。
这种现象,一方面是源自用户对产品的更高要求,他们已经不满足于仅使用基础设施与开发工具。另一方面是面对激烈的市场竞争与客户需求变化,他们需要借助更强大的工具来完成自己的业务创新与应用云上应用部署,这都需要更加敏捷、可扩展、智能的、数据驱动的PaaS服务来实现。
某知名机构2021下半年对国内公有云市场的分析数据表明,AI PaaS 在国内各 PaaS 细分市场中增速最高。
(四)数据类 PaaS 服务的两个发展趋势
趋势一:一体化。
所谓一体化趋势,是指数据库服务、数据分析服务和人工智能服务构成了一个完整闭环。如图15所示,人、应用程序和设备作为数据源产生数据,原始数据进入数据湖,作为机器学习类服务和数据分析类服务的数据源,它们处理后的数据被保存进关系或非关系型数据库中。此类数据再反哺人、应用程序和设备,比如提供数据报表、画像标签、分析预测等能力,从而促进业务数字化水平,并完成数据处理闭环。
图15 亚马逊云科技上的数据闭环
图16是在 Amazon re:Invent 2021 - Database, Analytics, and Machine Learning Keynote with Swami Sivasubramanian 演讲中提到的一个客户案例。该案例充分体现了数据在一完整数据体系中的流转过程。
图16 亚马逊云科技上的数据闭环案例(ADP)(来源:Amazon re:Invent 2021 )
这种闭环模式,对公有云平台提供商提出了高要求。他们不能孤立地对待这些服务,而需要打通服务边界,建立数据自由流通的渠道,这反过来又要求打通企业的部门墙,实现数据服务一盘棋。
趋势二:无服务器化(Serverless)。
在笔者的另一篇文章《亚马逊云科技15 年:从 Serverful 到 Serverless》中,详细阐述了Serverless。表4列出了2021年亚马逊云科技部分 Serverless 服务。可以看出,过去亚马逊云科技的 Serverless 工作主要还是在 aPaaS 和 dbPaaS 领域。笔者大胆预测,这两个领域的 Serverless 化工作接近完成,接下来数据分析和人工智能服务的 Serverless 化将是他们的工作重心。
表4 亚马逊云科技部分 Serverless 服务(2021年)
关于服务 Serverless 化的好处,文章中提到了三个直接好处:节省成本、降低技术和管理负担,以及加快应用交付速度,和两个间接好处:讨好用户、施压追随者。相信亚马逊云科技后续有越来越多的 Serverless 化数据分析和人工智能服务推出。
就在几天前(7月12日),亚马逊首席技术官 Werner 博士在纽约亚马逊云科技峰会上正式宣布 Amazon Redshift Serverless GA,这又一次印证了笔者的判断。至此,亚马逊云科技已经完成数据分析三大件(EMR,MSK,Redshift)的 Serverless 化。
PaaS 再升级背景下,企业的应对之策
前文厘清了 PaaS 的概念,阐述了 PaaS 的发展趋势。过去,是得 aPaaS 者得 PaaS 天下,而未来,则是得数据类 PaaS 者得 PaaS 天下。在 PaaS 这种进化升级背景下,我们再来看看各类企业的应对之道。这里主要针对国内企业。
首先说说大中型传统企业。
国内大中型传统企业,大部分都已完成 IaaS 云平台的建设,企业上云已完成过半甚至更多。往往都设立了大数据部门,建设了大数据平台。但是,大数据平台和云平台无论在组织结构上还是基础设施上都是分离的。大数据平台基本上都是池化的,买几千台服务器搞个大池子,提供的基本上是人机交互式接口。
很显然,这种模式很难满足这些企业未来的数字化要求。笔者建议做如图17所示的改变:
将大数据平台和云平台合并,由合并后的新统一云平台提供服务化的数据分析服务,从而实现大数据平台由池化和工具化向云化和服务化的转变。
将大数据平台团队和云计算团队合并,大数据平台团队成为云计算团队的一部分,即大数据团队成为云计算部门中的大数据 PaaS 团队。
图17 大型传统企业的 PaaS 转型
引申一下,现在大中型传统企业所说的“上云”,往往还是其字面意思,即“把应用搬到云上”,也就是把系统从小机、物理机或 VMware 虚拟机上搬到云虚拟机上,用到的还只是云的计算、存储、网络和数据库等基础能力。更高层次的“上云”,应该是“云化”,包括:基础设施(含大数据平台和人工智能平台)云化;应用开发平台和开发组件上云并 aPaaS 化;应用云原生化;业务、数据和智能能力中台化,并建立必要的配套机制,使其得到广泛应用。关于企业上云,笔者在另一篇文章《为什么企业全面云化需要 IT 战略支撑和驱动》中有所谈及。
再来说说国内公有云厂商。
国内几个大型公有云厂商,近年不约而同地宣告要把发展 PaaS 作为未来的重点发力方向。那么,根据前述观点,他们需把工作重心放到一体化、Serverless 化的数据类 PaaS 服务上。笔者多个深度使用国内公有云服务的朋友都反馈,国内公有云的 IaaS 服务离亚马逊云科技的距离其实不大,但数据分析和人工智能类服务的差距还相当大。
再说说国内行业云提供商。
国内行业云提供商很多,但似乎没几家真正成气候的。从 IaaS 角度,行业云的产品和市场实力、规模自然没法和大型公有云相提并论,因此,只拼 IaaS 那肯定是拼不过的。那就只能在 PaaS 和 SaaS 上发力了。
从 PaaS 角度,行业云要将其行业属性注入,尤其是要注入数据类PaaS服务。看到有好几家行业云,主要还是做卖 IaaS 生意,数据分析服务没有,人工智能服务没有。没有带有行业属性并且自己大规模深度使用的 PaaS 服务,那行业云就无法成为真正的行业云。
最后说说中小企业。
上公有云是中小企业的最佳选择。企业创立之初,就能利用到业界最新最领先的云服务,包括 PaaS 服务,聚焦业务发展,这在没有公有云的年代是难以想象的。根据前面提到的IT旅程,由应用创建开始,到数据分析,到人工智能,充分利用云上的各种服务,打造先进的云原生应用系统,为业务发展提供灵活而强大的支撑力和驱动力。
小结
综上所述,PaaS 当下的再升级路径,是在由以应用类aPaaS服务为中心向以数据类PaaS服务为重心发展。
这种进化升级趋势,和时下流行的数字化转型密不可分。数字化转型以业务模式转型和业务流程效率提升为目标,以IT技术作为支撑,是IT技术的综合运用。“以云为体,数智为用”,即以云为体系和基座,以人工智能、大数据、区块链等新一代 IT 技术的综合运用来解决系统化问题。曾经有位领导问我,数字化应用到底是什么样的。我回答道,通常来说,使用大数据服务和人工智能服务越多的应用,其数字化程度往往越高。图18中的曲线可能不太精确,但笔者坚定地认为,数据类 PaaS,特别是数据分析和人工智能类服务,是提升业务数字化水平的利器。
图18 数据类 PaaS 服务的运用和业务数字化水平之间的关系
PaaS 的这次再升级,不是以人的意志为转移的,而是和这轮波澜壮阔的数字化转型发展大潮密不可分。
本篇作者
刘世民
云计算技术专家,曾就职于华为、IBM、海航等公司,专注于云计算。曾在海航集团易航科技担任云服务事业群总经理一职,负责 IDC、云平台、系统运维、信息安全以及用户服务等业务。维护有“世民谈云计算”技术博客和微信公众号。《OpenShift云原生架构原理与实践》作者之一、《Ceph Cookbook中文版》《精通OpenStack》、《机器学习即服务:将Python机器学习创意快速转变为云端Web应用程序》译者之一。
阅读原文:https://dev.amazoncloud.cn/column/article/63bd38ed23473c0e90b8d8c6