阿里云对话 Tapdata:「开发者优先」正在影响商业化软件的开源选择

news2024/11/23 7:04:19

在刚刚过去的2022年,Tapdata 带着开源项目 PDK(Plugin Development Kit)及 Tapdata Community 和大家见面,兑现了我们对自己以及开发者们的开源承诺,同时与阿里云等生态伙伴联合,加速构建更加开放的数据生态。

近日,Tapdata 创始人兼 CEO TJ 在阿里云「大咖说」栏目中,对话阿里云数据库开源负责人惊玄,彼此围绕数据技术开放生态这一主题展开交流,主要内容包括:

  • 一个良好的开源生态具有哪些特征?
  • 开源与商业一定是对立的吗?
  • 开源产品应该如何做好商业化?

👆🏻👆🏻戳这里,观看完整对话视频

以下为部分核心对话内容整理:

一、Tapdata 对于开源整体策略的思考

Tapdata 的目标其实很明确,关于开源,问题从来不是要不要开源,而是什么时候开源。
在这里插入图片描述

但之所以选择在公司成立的第三个年头,而不是起始点就选择开源,也的确有我们的考量。从 DaaS(数据即服务,Data as a Service)起步的我们,其实最初也不确定这个新的概念是否能被市场接受并得到验证。因此,我们花了两年时间来寻找一个答案——在没有推广的情况下,我们逐渐积累起一批客户,并从内外得到了很多正向的反馈。于是我们知道,是时候了,Tapdata 会是一个值得大家使用的产品,DaaS 也是一个值得大家尝试的处理数据的新方式。

因此,虽然市场的开源热潮已经退去,我们仍然选择了开源,希望更多开发者能够接触到这样好用的技术,这也是我们的初衷。

二、Tapdata 开源发展基础路径与 PolarDB 有哪些合作点

Tapdata 核心职能是数据服务,虽然也会涉及存储,但我们的定位也非常明确——Tapdata 本身不是做存储的,同时和数据库之间存在非常紧密的上下游和生态关系。这里存在两种生态合作方式:

  1. 将数据库作为我们数据的来源。DaaS 平台不会直接产生企业核心数据,而是从 PolarDB 这样的生产数据库中获取数据;
  2. 将数据库作为我们数据的目标。这种情况下,Tapdata 会帮助企业将大量孤岛数据汇聚到中央化平台,其上,可以再同一处快速访问到想要的所有主数据、核心数据,而且这些数据还是实时更新的,因此,我们需要将数据放到一个分布式、大容量的现代数据库中。PolarDB 就完全符合需求,可以作为 DaaS 服务的存储,成为我们的一个目标。

在这里插入图片描述

此外,从数据汇聚的角度来看,Tapdata 与开源 PolarDB 也不乏不谋而合的适配点,前者是功能强大的数据高速公路,专注实时数据集成与实时数据服务,未来还会向以主数据为代表的数据资产管理进一步发展;后者作为云原生分布式开源数据库,未来的定位也是想做数据大集中,这也是 PolarDB 希望主推的应用场景。在这一点上,针对用户痛点,双方未来也有非常大的合作空间,也期待碰撞出更多可能。

三、Tapdata 主要解决的用户场景有哪些

从创业之初开始,Tapdata 的路径就不曾稍改——我们要做 DaaS,为企业提供一个数据即服务的实时数据服务平台。这是个新的形式,而新型产品意味着更大的挑战,我们需要让用户理解我们的价值。在实现实时数据服务,走向更深层产品形态的途中,我们投入大量时间和资源,构造了一套稳固可靠、内置多种数据源的数据集成系统,从而衍生了一个独特的产品,那就是实时数据集成,这也是目前我们的主流产品形式,支持将企业各个业务系统,包括数据库系统、文件系统等的数据第一时间的采集过来,放到中央化存储里。实时数据集成与实时数据服务两大能力,可以满足企业内部的多种数据场景需求:

  • 同构数据实时复制或同步,用以替换 Informatica、OGG 等
    类似 Oracle → Oracle 的高可用、灾备,或数据备份等需求,传统解决方案一般会选择一些昂贵的商用工具来解决,Tapdata 则提供了一个低成本的新选择。
  • 异构数据实时复制或同步,低代码易操作
    类似于新、老业务系统间的数据交换与同步,Tapdata 也可以提供很好的支撑。无需写代码,即可将各种数据库来源的数据通过托拉拽的方式,高度同步、一致地复制到目标端的新系统中。
  • 实时数据服务(核心能力)
    这是经多个成功案例验证有效的企业数据解决方案。其独特性在于,虽然架构类似,本质也是汇聚数据,但与大数据并不相同。后者主做 AP 事务,即对报表、指标、历史数据的分析与洞察;而 Tapdata 则是通过自身的实时接入能力,第一时间获取来自 Oracle、 MySQL 等的交易数据、订单数据、客户数据等,放到一个存储中,类似 MongoDB、TiDB、PolarDB 这样的分布数据库中。如此,企业就可以直接从中央化存储中,通过 API 或者直接的数据库调用方式获取这些经整合、处理、加工的完整、一致的企业数据。

四、并驾齐驱的开源与商业化

在这里插入图片描述

作为开源社区“老兵”,TJ 深知开源和商业化从来都不是“对着干”的关系,相反,开源还能够为商业化提供非常好的支撑。近年来多家大型开源公司的上市,也可以证明这一点,开源社区的力量不容小觑。

海外有个说法叫“Developer First”(开发者优先),随着 IT 对企业的贡献越来越大,开发者的价值也越来越高,他们在公司中语权也越来越重,基本上很多重要的产品选型或者技术选型都是由开发者来决定。而开发者惯常接触的往往不是那些传统的商业化闭源软件, 他们会更加偏爱在无需申请预算的情况下,可以怀抱学习心态来挖掘探索,这就是开源的重要所在。如果一味不拥抱开源,我们的技术可能就没有机会来到开发者们手上。
在这里插入图片描述

除此之外,单就 Tapdata 而言,我们的使命是“Make Your Data on Tap”,通俗讲就是让数据向自来水一样方便使用,但同时这也意味着我们需要对接的数据系统非常庞杂。尤其在面对大中型传统企业时,历史发展积淀了数十成百套业务系统,覆盖的数据源类型繁多,对我们产品的挑战也就更多。为了满足不同用户的各式数据源需求,单靠常规方式来开发,支持速度很难得到明显提升。但如果我们选择开源,将开发权限交予有需求的开发者自己以及数据库伙伴手中,一方面,开发者通过接入数据源获取产品能力,数据库厂商可以快速获得对50+数据源的对接能力;另一方面,Tapdata 支持的数据源快速提升,同时可以透过数据库生态伙伴触达更多潜力用户,这无疑是三方获利的选择,更是开源的力量。

五、一个良好的开源生态应该具备哪些特征

  • 整个研发过程结合社区:技术设计、技术讨论也要是开放的,能够为社区用户提供健康、有意义且中肯的建议,而不是完全由内部产品经理决定,让外部的社区开发者能够真正接触到生态。开发流程也从闭源的模式逐渐转移到开源的模式,启用 GitHub 工具,使用开源方式进行事项管理、进度推进以及 tracking,开放透明,融入生态。
  • 社区有一定的活跃度:项目贡献者逐渐由以内部成员为主,向越来越多的外部开发者参与转变
  • 重视开源社区的用户:提供和付费用户一视同仁的技术支持与服务,重视社区用户的声音。

更多精彩观点及讨论,详解完整版对话视频。

【相关阅读】

  • Tapdata Cloud 场景通关系列:Oracle → MySQL 异构实时同步
  • Tapdata Cloud 场景通关系列:集成阿里云计算巢,实现一键云上部署真正开箱即用
  • Tapdata Cloud 场景通关系列:将数据导入阿里云 Tablestore,获得毫秒级在线查询和检索能力
  • Tapdata Cloud 场景通关系列:数据入湖仓之 MySQL → Doris,极简架构,更实时、更简便

原文链接:https://tapdata.net/developer-first-influence-the-way-go-to-market.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/169969.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux基础 - DNS服务进阶

‍‍🏡博客主页: Passerby_Wang的博客_CSDN博客-系统运维,云计算,Linux基础领域博主🌐所属专栏:『Linux基础』🌌上期文章: Linux基础 - DNS服务基础📰如觉得博主文章写的不错或对你有所帮助的话…

贪心策略(三)多机调度问题、活动选择(库函数sort的整理)

把sort库函数的使用总结一下&#xff1a; 1、头文件#include<algorithm> 时间复杂度nlog(n) 2、使用格式 sort&#xff08;arr.begin(), arr.end()&#xff09;&#xff1b; 3、默认使用升序排序&#xff0c;第三个参数默认使用less<T>() 4、如果需要进行降序排序…

springcloud + nacos多环境联调、本地联调(即灰度版本)

背景&#xff1a;当我们使用nacos为注册中心注册微服务时&#xff0c;想本地环境和测试环境公用一个nacos&#xff0c;即注册中心等基础服务共用。当我们在服务A开发时&#xff0c;本地服务和测试环境服务都是注册到同一个nacos&#xff0c;由于nacos自带负载均衡策略&#xff…

小程序开发经验分享(9)小程序快速上线汇总

微信小程序申请 开发中的Appid 需要从“微信公众平台”中获取 如果是直接从git上拉取的话 直接项目导入就可以了(名称可以是中文) 小程序基础配置 如果需要修改显示的名称和appid可以去生成的配置文件project.config.json里面修改

前端特效之毛玻璃-倾斜-日历

前端特效之毛玻璃-倾斜-日历描述项目效果index.htmlindex.css描述 项目描述开发语言HTML、JavaScript、CSS库dyCalendarJS、vanilla-tilt 该项目中需要使用到的库有&#xff1a; dyCalendarJS vanilla-tilt.js 是 JavaScript 中的一个平滑的 3D 倾斜库。vanilla-tilt dyCalen…

MS SQL Server 日志审核工具

手动审核数据库活动是一项艰巨的任务。有效实现这一目标的最佳方法是使用全面的解决方案来简化和自动化数据库和活动监控。该解决方案还应使数据库管理员能够监控、跟踪、即时识别任何操作问题的根本原因&#xff0c;并实时检测对机密数据的未经授权的访问。 审核 Microsoft S…

Bootstrap踩坑笔记(记录Bootstrap当中的核心知识点)

目录 1.Bootstrap官网 2.核心1:布局&#xff08;栅格系统&#xff09; 3.核心知识点3:响应式布局 A.容器 B.行 C.列 注意: D.案例: E.列偏移 F.列排序 4. 样式 A.按钮 B.图片 C.表格 5.组件 A.导航条 B.分页条 C.js插件 1.Bootstrap官网 Bootsrap官网 2.核心1…

docker入门(二):docker的常用命令

文章目录前言docker常用命令1 启停类/帮助 命令2镜像命令3 容器命令结语前言 大家好&#xff0c;这是我学习docker系列的笔记文章&#xff0c;目标是掌握docker,为后续学习K8s做准备。本文列举了docker的常用命令&#xff0c;感兴趣的朋友可以看一下以前的文章。 上一篇&#…

处理Springboot项目启动时streamBridge.send导致的卡住卡死问题

现象 我们的Spring Boot 项目启动时&#xff0c;偶现卡死的现象&#xff0c;启动到一半卡主不动了 2023-01-16 10:23:10.338 INFO 1 --- [ restartedMain] com.hazelcast.core.LifecycleService : [172.18.0.14]:5701 [dev] [4.2.4] [172.18.0.14]:5701 is STARTED 20…

Unity脚本 --- 常用API(常用类) --- Component类和Transform类

上面这个是Unity核心类图 第一部分 --- Component类 提供了查找组件的方法&#xff08;当前物体的&#xff0c;子物体&#xff0c;父物体的&#xff09; 1.颜色&#xff08;color&#xff09;是材质&#xff08;meterial&#xff09;控制的&#xff0c;meterial&#xff08…

【FreeRTOS】在Cortex-M4开发板上移植FreeRTOS并且实现LED灯闪烁(保姆级教程)

相信有不少小伙伴手上只有M4的开发板&#xff0c;想要移植FreeRTOS&#xff1b;但是&#xff0c;网上大部分都是M3移植教程。因此&#xff0c;陷入深深的迷茫中&#xff0c;难不成只能使用仿真了&#xff1f;&#xff1f;&#xff1f;&#x1f914;因此&#xff0c;小编特意写了…

【Linux】静态库和动态库

Linux为什么不允许普通用户给目录建立硬链接呢&#xff1f; 系统层面上有.和…硬链接指向目录。假设我们是超级用户&#xff0c;允许给目录建立硬链接&#xff0c;给根目录建立硬链接&#xff0c;从根目录开始查找&#xff0c;当查找硬链接的时候就是根目录&#xff0c;这时候递…

面试官让我聊聊 MQ 的数据丢失问题,没想到水这么深。。。

目录 一、背景引入二、Kafka分布式存储架构三、Kafka高可用架构四、画图复现Kafka的写入数据丢失问题五、Kafka的ISR机制是什么&#xff1f;六、Kafka写入的数据如何保证不丢失&#xff1f;七、总结 一、背景引入 这篇文章&#xff0c;给大家聊一下写入Kafka的数据该如何保证…

Git常用命令(全局设置获取仓库)

新建仓库: 填写名称等信息&#xff0c;根据需要选择私有&#xff0c;开源等选项。 创建完成。 邀请成员&#xff1a; Git常用命令 Git全局设置 首先要做的是设置用户名和email地址。这是非常重要的&#xff0c;每次Git提交都会使用该用户信息。 设置用户信息&#xff1a; …

岁末年初捷报频传 HashData斩获多项行业殊荣

凯歌高奏辞旧岁&#xff0c;数据赋智谱新篇。 刚刚过去的2022年&#xff0c;面对充满变数的外部环境&#xff0c;HashData始终坚持以技术为本&#xff0c;持续全面创新&#xff0c;适应数字经济发展趋势&#xff0c;笃行致远&#xff0c;砥砺前行&#xff0c;积极推动企业“上…

VPS融合怪测评脚本(主体已完善,历史遗留问题解决时间未知)(VPS fusion monster evaluation script)

ecs 原仓库链接&#xff1a;https://github.com/spiritLHLS/ecs 支持系统&#xff1a;Ubuntu 18&#xff0c;Debian 8&#xff0c;centos 7&#xff0c;Fedora&#xff0c;Almalinux 8.5, Arch 融合怪测评脚本 bash <(wget -qO- --no-check-certificate https://gitlab.…

Sealer 0.9 :帮助集群和分布式应用实现 Build、 Share、Run

作者&#xff1a;sealer 社区 新春之际&#xff0c;很高兴在此时宣布 Sealer [ 1] 0.9 版本的正式发布。Sealer 是一款致力于探索面向分布式应用的快速打包、交付和运行的解决方案。2021 年5月 Sealer 项目正式开源&#xff1b;短短一年时间&#xff0c;Sealer 在 2022 年 4 月…

人工智能图像识别四大算子

文章目录背景引入图像识别发展简介边缘检测算法*Prewitt算子**Sobel算子**Laplace算子**Conny算子** 文末寄语*背景引入 图像识别是当今计算机科学最热门的研究方向之一。随着科学技术的发展和人类社会的不断进步&#xff0c;图像识别技术在很多行业得到了广泛的应用。本章除了…

【单链表】数据结构,详解单链表,java实现代码

前言&#xff1a; 大家好&#xff0c;我是良辰丫&#x1f353;&#x1f353;&#x1f353;&#xff0c;今天我和大家一起了解一下数据结构中的链表&#xff0c;链表&#xff0c;顾名思义是用链子把一个个数据串连起了的&#xff0c;那么链表和顺序表又有什么不同呢&#xff1f;…

mysql存储过程基本语法

本文来说下mysql存储过程基本语法 文章目录基本语法使用实例变量的使用变量定义declare语句变量赋值用户变量存储过程的参数in 输入参数out 输出参数inout输入输出参数本文小结基本语法 存储过程就是具有名字的一段代码&#xff0c;用来完成一个特定的功能。创建的存储过程保存…