前言

其实我之前是不太了解时序数据库以及它相关的机制的，只是大概知晓它的用途。但因为公司的业务需求，我意外参与并主导了公司内部开源时序数据库influxdb的引擎改造，所以我也就顺理成章的成为时序数据库“从业者”。

造飞机的人需要时刻理解开飞机的人的需求。我不算时序数据库的使用者，但我想站在用户的角度去思考，他们需要一款怎样的“时序数据库”，我司的influxdb的第一阶段改造已经完成，所以我写下这篇文章，总结一下自己在开发中的一些思考与想法。也许有些地方还不够成熟，但胜在人会慢慢进步。

正文

一、几款优秀的时序数据库

Prometheus、Influxdb和opentsdb是三款业内比较知名且实际生产使用的时序数据库了，总的来说三款各有优缺点，这里不谈它们的性能，主要谈谈使用和生态。

Influxdb：目前开源排名最高的时序数据库，是单独的数据库，主要就是用来写入和查询数据。目前集群版已经闭源商业化，开源版仅支持单机模式。数据采集使用push模式（数据源主动将数据写入influxdb）。优势是提供类SQL的查询引擎。

InfluxDB在DB-Engines的时序数据库排名中遥遥领先

Prometheus：提供了一整套的监控体系，包括数据的采集存储报警等。仅支持单机，数据写入本地。数据采集使用的是pull模式。

opentsdb：基于hbase做的时序数据库，最大的特点是由hbase带来的横向扩展能力，最大的缺点是hbase带来的笨拙感，一旦集群扩大，运维可能会烦死人。

二、时序数据库要解决的痛点

公司内部团队曾经用mysql+中间件做过一款伪时序数据库，但是由于mysql底层的存储形式导致其天然不适应时序数据的场景。且其写入能力也完全无法满足时序数据大量写入的要求。

那么时序数据的特点是什么呢？

1、数据随着时间增长，根据维度取值，而数据纬度几乎不变。

2、持续高并发写入，设备越多，写入数量越大，而且由于定期采样，写入量平稳。但是几乎不会有更新操作（一个设备在某个时间点产生的数据不会变动）以及单独数据点的删除（通常只会删除过期时间范围内所有的数据）

3、查询一般都是查最近产生的数据，很少会去查询过期的数据。

4、设备之间的数据关联性小，同种类设备A和设备B产生的数据互相并不依赖。你并不需要join。

由上述特点结合我与iot行业相关人员的探讨，我总结出以下时序数据库要解决的痛点

1、海量设备带来的写入压力

2、如何高效存储大量纬度相同仅值和时间戳不同的数据

3、能够方便的剔除过期数据，或者能够把数据冷热分离以降低存储成本

4、传统企业it人员专业素质不高带来的对整个时序数据库体系的易用性要求

三、现有产品已经满足的和缺失的

假如你要问我写多读少的场景适合什么算法？显然那就是LSM Tree。更妙的是，时序数据很少有更新、删除操作，对事物的需求也不高，这很好的规避了LSMT对于update和delete上的缺陷。市面上的时序数据库基本都是采用LSM Tree的架构。

关于数据的压缩，很容易的能想到同纬度的数据压缩，时间戳前缀压缩等想法，这些在各家数据库都有体现。当然opentsdb似乎由于底层的hbase无法更好的针对时序数据的特点进行压缩，与之类似的问题是opentsdb必须手动去根据时间段来管理数据，而Influxdb、Prometheus包括Graphite等都是可以自己根据时间段来分割数据的。这样当你要删除过期数据时，只要删除对应的block就行。

对于数据查询，经常有人吐槽SQL不太行，所以有后面的NO-SQL出现。但是当大家真的想去做些分析时，还是不由自主的想念SQL，想在KV上用上SQL（new sql），哈哈哈，SQL真香。所以好的内置的针对时序数据的sql引擎也是让人感到愉悦、不可缺少的东西。目前Influxdb在这一块大大领先。

如果你想长时间保存数据，一个比较麻烦的问题是单机总是有容量上限的，即使你做一个上层中间件来搞一个所谓的集群。另外关于高可用，坏盘、数据迁移等等是真实的让人头痛的东西，我个人比较反感简单的双写，毕竟你要浪费两倍的CPU和内存，LSMT的Compaction带来的写放大本来就让人头疼，你还要对你的数据做两次，OMG！（李佳琦脸）真让人接受不能。

遗憾的是目前除了opentsdb似乎都落本地，麻烦事儿。