导读: 时序数据库(Time Series Database)在最近几年被越来越多的用户接受并使用,并有广泛的应用场景。云原生时序数据库 TDengine 一直稳居墨天轮时序数据库榜首,其近期的海外发展也初见成效。本期,墨天轮技术社区邀请到了涛思数据领航者——陶建辉先生,针对公司创立初心、时序数据库未来发展趋势、数据库出海等话题展开探讨,同时有过三次创业经历的他也将分享自己的心得体会,以及对数据库从业者未来发展的建议!
涛思数据创始人&CEO —— 陶建辉
TDengine 创始人与核心开发。1994年到美国留学,1997年起,先后在芝加哥 Motorola、3Com 等公司从事无线互联网的研发工作。2008年初回到北京创办和信,后被联发科收购。2013年初创办快乐妈咪,后被太平洋网络收购。2017年5月创办涛思数据,专注物联网大数据的处理,产品 TDengine 开源后,在 GitHub 全球趋势排行榜上多日排名第一。涛思数据已获红杉、GGV、经纬、明势资本等多家机构的近7000万美元的投资。
—— 以下为采访全文 ——
墨天轮社区:您创业选择的行业多样,从通讯、母婴行业再到现在的时序数据库,跨越的幅度也比较大,您最后选择时序数据库是基于怎样的初衷?
陶建辉:我上一家创业公司是做母婴智能硬件,智能硬件产生的数据都是时序数据,因此让我了解到了时序数据这样的场景。在公司被收购后,我看了很多智能硬件、物联网、工业互联网的项目,觉得时序数据的处理是一个共性的、相对标准的需求。而且2016年自动驾驶很火,自动驾驶能产生海量的时序数据,分布式能源也是很多人讨论,这些分布式能源系统产生的数据也是海量的,因此我认为时序数据处理将成为一个重要的技术领域。
调研发现市场上已经有 InfluxDB、OpenTSDB 这些产品,但这些产品做得一般般,并没有充分利用时序数据的特性,而当时 InfluxDB 已经融资6000多万美元,因此我认为这是一个值得创业的赛道。2016年底就自己动手开始写程序,验证自己提出的 “一个数据采集点一张表” 这一数据模型的效率,测试发现,居然写入和查询性能至少比 InfluxDB 快五倍以上,因此我就正式决定融资、组建团队,这样,涛思数据在2017年6月就正式成立了。
墨天轮社区:TDengine 在开源方面是比较成功的,如何在开源的同时实现商业化?
陶建辉:当前 TDengine 主要通过企业版和云服务实现商业化。相比开源版,TDengine 企业版拥有更多企业所需要的数据库运营维护功能,比如数据备份、容灾、加密、安全传输,以及可视化的管理界面、数据的多级存储、边云协同等等。但开源版与企业版的核心功能都是完全一样的。
云服务更多的是面向中小企业用户,是全托管的时序数据处理平台,这也将是我们今后很重要的收入来源。
墨天轮社区:相较于 InfluxDB,TDengine 有哪些差异化的优势?目前您认为 TDengine 最成功的标杆应用案例是什么?
陶建辉:相对于 InfluxDB, TDengine 有以下几方面的优势:
- 超强性能,基于全球公认的时序数据基准测试结果来看,TDengine 的写入性能是其 3.0 ~ 10.6倍, TDengine 的查询性能是其 1.9 ~ 37.0 倍,平均 11.3 倍,磁盘空间的占用也有明显优势;
- TDengine 不仅只是一个时序数据库,它还带有缓存、数据订阅、流式计算的功能,是一个极简的时序数据处理平台,这样能大幅降低整个数据平台设计的复杂度和运维成本;
- TDengine 更简单易用,因为支持标准 SQL。
TDengine 最成功的标杆案例之一应该是跨越速运的车辆轨迹数据处理,在资源的节省方面极其显著。与 Hadoop 系统相比,采用 TDengine 之后,服务器台数由21台降为3台,磁盘空间由每日的352G降为4G,而且运营维护变的极为简单,降低人力成本(详细请看:https://www.taosdata.com/user-cases/4863.html)。
墨天轮社区:最近 AI 热潮来袭,TDengine 在人工智能方面有哪些发展成果及未来规划?
陶建辉:TDengine 一直再筹划进入人工智能领域,因为时序数据分析需要 AI 。我们早已规划用 AI 以及机器学习的方法来做时序数据预测以及时序数据的异常检测,而且通过插件的方式来提供,同时也提供一个分布式计算框架,用户还可以基于这个框架开发并运行自己的算法。这样,传统的基于简单规则的实时预警以及预测就会更加智能、精准,让用户能更好的洞察业务运营的状态,更快更好地做出商业决定,提升整个运营的效率。
墨天轮社区:数据库出海是一个老生常谈的话题。您认为现阶段TDengine的出海道路走得如何?针对中国数据库出海,您有哪些经验和心得分享一下吗?
陶建辉:TDengine 的出海还在尝试之中,已经花了一年时间了,有了一些初步效果。主要表现在两方面,首先,TDengine 英文网站的流量在大幅上升,每天总有人通过这个英文网站联系我们销售;其次,我们在北美已经有付费客户,越来越多的美国公司与 TDengine 在结成合作伙伴关系。
数据库乃至所有2B软件出海很不容易,目前还没有成功的先例。但是数据库软件要获得真正的成功,不沦落为一个系统集成商、软件定制开发商,必须走出海这条路。因为数据库软件是标准化的产品,与文化政治形态关系不大,适合全球推广。而在国内,为软件特别是底层软件买单的理念尚未形成,且整个中国市场不到全球市场的10%,如果放弃90%的市场不做,那很难与海外对手 PK,最后一定会失败。虽然中国在全力支持国产软件,但最终的选择权在用户手上,中国非军工、政府、国企的用户,最终一定会选择使用在全球最有竞争力的开源产品。这样只做国内市场的产品最终会很难过个好日子。
墨天轮社区:您认为目前国产时序数据库的落地情况如何?主要应用在了哪些领域?面临哪些困难和挑战?
陶建辉:中国是制造大国,目前又在全力推动数字化转型,因此时序数据库在中国有很多应用场景。从 TDengine 的安装实例就能看出,从2020年8月 TDengine 开源集群版后,已经有超过25万 TDengine 安装实例,遍布全球50多个国家,但近70%的安装还是在中国。因此中国是需要时序数据库的。
从我们用户来看,用户分布在电力、石油、石化、制造、汽车、矿山、烟草、交通、物流、食品等众多领域。所有需要采集数据的场景,都可以使用时序数据库。
在中国面临的最大挑战就是用户不乐意花钱,即使购买,客单价也很难上去。还有一个,中国绝大部分企业还没有购买软件服务的意识,这样导致大部分合同还是永久License,而不是按年续费。
墨天轮社区:您认为初创公司如何才能招到高精尖人才、减少人才流失?
陶建辉:第一,待遇要到位,总的待遇包一定要超过华为、阿里、腾讯等企业,否则绝大部分高端人才不会加盟;第二,要有梦想,公司的发展要有足够大的空间和市场价值,这样优秀人才的个人价值才能充分体现。减少人才流失,不外乎几个手段:
- 待遇需要依据市场的变化做出调整;
- 打造企业文化和价值观,多关心员工并处处为他着想,让他感觉到被尊重、是公司大家庭的一份子;
- 要多交给有挑战性的工作,让他觉得有施展才华的舞台,让他能看到公司的成长以及他个人的成长。
墨天轮社区:您创业到现在有15年了,讲讲您最难的时候。为什么会陷入危机? 是怎么渡过的?
陶建辉:我创业最难的时候,是2010年年初,公司(和信)一分钱都没有了,办公室因为拖欠房租都被封了,完全是走投无路。但我当时坚信,我做的手机消息推送服务一定有市场,技术绝对领先,因此我就咬牙扛了下来,找同学、朋友借钱度过的难关。幸运的是,我坚持几个月后,和信就被台湾的联发科收购了。
墨天轮社区:都说35岁是技术从业者的一道坎,面对年龄焦虑,您认为数据库从业者如何摆正心态、坦然面对?
陶建辉:对于数据库开发而言,35岁是刚刚开始的年龄。 要成为系统软件的开发高手,大学毕业后,如果没有十年以上的技术磨炼,是难开发操作系统、数据库这类软件的。而且这十年,是需要有研发高手指导、参与过同样复杂度软件开发的。另外一方面,应用软件的开发每一年都不同,各种语言、工具层出不穷,但对于数据库的开发而言,五年、十年都几乎没有什么变化,因为底层技术的改变是缓慢的,很适合35岁以后的人来做,因此数据库的研发特适合能坐得住、能且乐意啃硬骨头的人做。
阅读原文:https://www.modb.pro/db/633711
欲了解更多可浏览墨天轮技术社区,围绕数据人的学习成长提供一站式的全面服务,打造集新闻资讯、在线问答、活动直播、在线课程、文档阅览、资源下载、知识分享及在线运维为一体的统一平台,持续促进数据领域的知识传播和技术创新。