时序数据库 InfluxDB（一）

news2026/2/13 0:24:38

时序数据库 InfluxDB（一）

数据库种类有很多，比如传统的关系型数据库 RDBMS（如 MySQL ），NoSQL 数据库（如 MongoDB ），Key-Value 类型（如 redis ），Wide column 类型（如 HBase ）等等等等，当然还有本系列文章将会介绍的时序数据库 TSDB（如 InfluxDB ）。

时序数据库 TSDB

不同的数据库针对的应用场景有不同的偏重。TSDB（ time series database ）时序数据库是专门以时间维度进行设计和优化的。
TSDB 通常具有以下的特点：

时间是不可或缺的绝对主角（就像 MySQL 中的主键一样），数据按照时间顺序组织管理
高并发高吞吐量的数据写入
数据的更新很少发生
过期的数据可以批量删除

InfluxDB 就是一款非常优秀的时序数据库，高居 DB-Engines TSDB rank 榜首。

InfluxDB 分为免费的社区开源版本，以及需要收费的闭源商业版本，目前只有商业版本支持集群。

InfluxDB 的底层数据结构从 LSM 树到 B+ 树折腾了一通，最后自创了一个 TSM 树（ Time-Structured Merge Tree ），这也是它性能高且资源占用少的重要原因。

InfluxDB 由 go 语言编写而成，没有额外的依赖，它的查询语言 InfluxQL 与 SQL 极其相似，使用特别简单。

InfluxDB 基本概念

InfluxDB 有以下几个核心概念：
1、database ：
数据库。

2、measurement
类似于表。

3、retention policy（简称 RP ）
保留策略，由以下三个部分构成：

DURATION：数据的保留时长。
REPLICATION：集群模式下数据的副本数，单节点无效。
SHARD DURATION：可选项，shard group 划分的时间范围。

4、timestamp
时间戳，就像是所有数据的主键一样。

5、tag
tag key = tag value 键值对存储具体的数据，会构建索引有利于查询。tag set 就是 tag key-value 键值对的不同组合。

6、field
field key = field value 键值对也是存储具体的数据，但不会被索引。类似的 field set 就是 field key-value 的组合。

7、series
一个 series 序列是由同一个 RP 策略下的同一个 measurement 里的同一个 tag set 构成的数据集合。

8、point
一个 point 点代表了一条数据，由 measurement、tag set、field set、timestamp 组成。一个 series 上的某个 timestamp 时间对应唯一一个 point 。

Line protocol 行协议

行协议指定了写入数据的格式：

<measurement>[,<tag-key>=<tag-value>...] <field-key>=<field-value>[,<field2-key>=<field2-value>...] [unix-nano-timestamp]

符号 [] 代表可选项，符号 … 代表可以有多个，符号，用来分隔相同 tag 或者 field 下的多个数据，符号空格分隔 tag、field、timestamp 。

示例：
在这里插入图片描述

怎么去理解 series 和 point ？先看下图：
在这里插入图片描述

这张图选取了三种时序数据库的历年排名得分情况。首先，整个图表可以看成是一个 measurement ，它包含了许多数据；然后我们根据 db 名称构建 tag ，把 score 排名得分作为 field ，那么所有数据行就类似于：

measurement,db=InfluxDB score=5 timestamp
measurement,db=Kdb+ score=1 timestamp
measurement,db=Prometheus score=0.2 timestamp
...

上文说过 tag set 就是 tag key = tag value 的不同组合，因此这里的 tag set 有以下三种：

db=InfluxDB
db=Kdb+
db=Prometheus

三个 tag set 构成了三个 series ，每个 series 就可以看成是图中的一条线（一个维度），而每个 point 点就是 series 上具体某个 timestamp 对应的点。

与传统数据库的不同

InfluxDB 就是被设计用于处理时间序列的数据。传统SQL数据库虽然也可以处理时间序列数据，但并不是专门以此为目标的。InfluxDB 可以更加高效快速的存储大量时间序列数据并对这些数据进行实时分析。

在 InfluxDB 中，时间是绝对的主角，就像是SQL数据库中的主键一样，如果你不指定则会默认为系统当前时间，时间必须是 UNIX epoch ( GMT ) 或者 RFC3339 格式。

InfluxDB 不需要预先定义好数据的结构，你可以随时改变你的数据结构。InfluxDB 支持 continuous queries（连续查询，就是以时间划分范围自动定期执行某个查询）和 retention policies（保留策略）。InfluxDB 不支持跨 measurement 的 JOIN 查询。

InfluxDB 中的查询语言叫 InfluxQL ，语法与 SQL 极其相似，就是 select from where 那一套。

InfluxDB 并不是 CRUD，更像是 CR-ud ，意思就是更新和删除数据跟传统SQL数据库明显不一样：