摘要:本文整理自阿里巴巴集团副总裁、阿里巴巴开源技术委员会负责人贾扬清,在 Flink Forward Asia 2022 主会场的开场致辞。
Tips:点击「阅读原文」获取演讲 ppt~
云和开源,共生、共长、共植数字世界的根。从在云上使用开源软件的第一天开始,我们就一直在思考一个问题,如何让开源和商业化更好的结合。
最早的时候,开源软件需要用户手动下载和部署。但现在我们发现云已经给开源软件的部署和获取提供了一个更好的环境,用户不再需要担心开源软件的安装、管控、运维这一系列的需求。因为云已经提供了一个弹性的环境,让用户能够一键获得开源软件和开源平台的能力。
云和开源社区的共生,也使得用户能够有更加广阔和灵活的选择。今天开源软件的优势就是可以让每一个人都能寻找到最适合自己的选项,换句话说,就是可以找到一个能解决自身业务问题的开源软件组合。在这样的一个发展过程中,我们逐渐开始形成了一个概念,叫做云原生(Cloud Native)。
那么开源和商业化怎样形成共生和反哺的关系呢?我们认为云是当中最重要的一环。阿里巴巴在前面的十几年中,一直是开源软件和开源社区坚定的拥护者和实践者,在和开源互动中,形成了一个理念,叫做“三位一体”。
也就是开源社区的代码、阿里巴巴内部应用的代码、以及在阿里云上通过商业化的形式提供给客户的代码是同一套的。基于这样一个朴素的观感,我们需要把各种各样的需求抽象成统一的路线,坚定的推行下去。
如果拿阿里自己使用的开源软件为例的话,开源其实提供了一个非常好的用户体验空间。在阿里这样一个大规模的场景中,会产生很多个性化或者系统化的需求,这些需求和开源社区所关注的点一定是互补的。
所以就能发现,在其他企业应用开源软件、使用开源平台的时候,也会有一些和开源社区互补的需求。而阿里巴巴则可以将自己的最佳实践贡献到开源社区,让社区的应用性和大规模企业使用的稳定性、弹性等等有很好的结合。
以 Flink 为例,2016 年阿里巴巴拿 Flink 作为实时计算中的一条路线,和其他自研的各种流计算相比较、迭代,最终基于 Flink 建设了一个叫做 Blink 的内部体系。之后阿里逐渐将这个体系贡献到社区中,并把它合并到 Flink 的主要分支里。
2018 年阿里巴巴成为了 Flink 最大的贡献者,Flink PMC 当中 1/4 左右的成员都来自阿里巴巴;2020 年 Flink 被中国绝大多数的互联网企业,以流计算的实施标准来采用;直至今天 Flink 成为 Apache 社区蝉联两年最活跃的一个项目。
前面提到了云为用户获取开源软件提供了一个很好的平台。接下来想讲一下云与开源的迭代,让阿里在开源软件的方向上也有非常多新的探索。
以 Flink 为例,最初它只是一个以 Java API 来实现流计算的平台。然后在阿里自身的应用以及云上应用中,逐渐长出了一些类似于 SQL 的标准。在之前的一段时间里,根据阿里自己的使用需求,也在逐渐的在探索新的方向。
例如在数据集成方向,推动了 Flink CDC 的发展;Flink 和机器学习的结合有一个叫 Flink ML 的项目,也在不断地从 AI 的角度给流计算注入新的活力。同时我们还推出了动态表存储 Flink Table Store。以上这些新的方向,希望能够和社区一起探讨、合作、规划。
阿里巴巴不仅是开源软件的受益者,同时也是开源软件的贡献者。有了开源软件才使得阿里巴巴自身的业务以及阿里云的业务能够繁荣的发展。
开源已经成为阿里巴巴工程师文化中不可或缺的一部分,非常多的工程师在开源社区里汲取知识,像数据库、大数据、人工智能和云原生等。阿里也非常积极的参与到了很多开源软件、开源社区的建设中。在适当的时候,也会把自己所建设的项目贡献给开源社区。比如 Apache Flink、Apache Dubbo 等都是阿里希望能和社区一起共建的项目。
接下来阿里将会继续和开源社区,基于云给用户们提供更加容易触达的软件和使用软件的平台及方式,建设更加繁荣的开源社区。
Flink Forward Asia 2022
本届 Flink Forward Asia 更多精彩内容,可点击「阅读原文」或扫描图片二维码观看全部议题的视频回放及获取 FFA 2022 峰会资料!
▼ 关注「Apache Flink」,获取更多技术干货 ▼
点击「阅读原文」,获取演讲 PPT