Databend 产品月报（2024年8月）

news2026/3/26 19:54:23

很高兴为您带来 Databend 2024 年 8 月的最新更新、新功能和改进！我们希望这些增强功能对您有所帮助，并期待您的反馈。

Kafka Connect Sink Connector 插件

我们推出了一种将 Kafka 连接到 Databend 的新方式：databend-kafka-connect，这是一个 Kafka Connect sink connector 插件。该插件支持 Append Only 和 Upsert 两种写入模式，并能根据数据的 schema 自动在 Databend 中创建目标表。了解更多详情，请查看文档。

想亲身体验如何将 Kafka 消息加载到 Databend，请探索以下教程：

使用 bend-ingest-kafka 从 Kafka 加载数据：使用 bend-ingest-kafka 从 Kafka 加载数据 | Databend
使用 databend-kafka-connect 从 Kafka 加载数据：使用 databend-kafka-connect 从 Kafka 加载数据 | Databend

全文模糊搜索

全文搜索函数 MATCH 和 QUERY 现在可以在语法中包括以下选项，以支持模糊搜索：

fuzziness: 允许在指定的 Levenshtein 距离内匹配关键字。
operator: 指定多个查询关键字如何组合。可以设置为 OR（默认）或 AND。OR 返回包含任何查询关键字的结果，而 AND 返回包含所有查询关键字的结果。
lenient: 控制在查询文本无效时是否报告错误。默认为 false。如果设置为 true，当查询文本无效时不会报告错误，结果集将为空。

以下是一些简单的例子：

使用模糊度 fuzziness=1 时，查询关键字 "box" 允许匹配像 "fox" 这样的单词，因为 "box" 和 "fox" 的 Levenshtein 距离为 1：

SELECT id, score(), content FROM t WHERE match(content, 'box', 'fuzziness=1');

使用 operator=AND 时，以下查询要求结果中同时包含 "action" 和 "works"：

SELECT id, score(), content FROM t WHERE query('content:action works', 'fuzziness=1;operator=AND');

由于 fuzziness=1，它还会匹配像 "Actions" 和 "words" 这样的单词，因此会返回 "Actions speak louder than words"。

FUSE_STATISTIC 新增直方图信息

FUSE_STATISTIC 函数现在包括一个新的统计特性：直方图。这个新功能提供了有关每列数据分布的详细信息：

bucket id: 桶的标识符。
min: 桶内的最小值。
max: 桶内的最大值。
ndv (number of distinct values) : 桶内唯一值的计数。
count: 桶内的总值数量。

以下是一个简单的例子：

SELECT * FROM FUSE_STATISTIC('default', 'sample');

┌───────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ column_name │ distinct_count │                                                                                                                                                                                                histogram                                                                                                                                                                                               │
├─────────────┼────────────────┼────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┤
│ name        │              6 │ [bucket id: 0, min: "Alice", max: "Alice", ndv: 1.0, count: 1.0], [bucket id: 1, min: "Bob", max: "Bob", ndv: 1.0, count: 1.0], [bucket id: 2, min: "Charlie", max: "Charlie", ndv: 1.0, count: 1.0], [bucket id: 3, min: "Diana", max: "Diana", ndv: 1.0, count: 1.0], [bucket id: 4, min: "Eve", max: "Eve", ndv: 1.0, count: 1.0], [bucket id: 5, min: "Frank", max: "Frank", ndv: 1.0, count: 1.0] │
│ age         │              5 │ [bucket id: 0, min: "25", max: "25", ndv: 1.0, count: 1.0], [bucket id: 1, min: "28", max: "28", ndv: 1.0, count: 1.0], [bucket id: 2, min: "28", max: "28", ndv: 1.0, count: 1.0], [bucket id: 3, min: "30", max: "30", ndv: 1.0, count: 1.0], [bucket id: 4, min: "35", max: "35", ndv: 1.0, count: 1.0], [bucket id: 5, min: "40", max: "40", ndv: 1.0, count: 1.0]                                 │
│ user_id     │              6 │ [bucket id: 0, min: "1", max: "1", ndv: 1.0, count: 1.0], [bucket id: 1, min: "2", max: "2", ndv: 1.0, count: 1.0], [bucket id: 2, min: "3", max: "3", ndv: 1.0, count: 1.0], [bucket id: 3, min: "4", max: "4", ndv: 1.0, count: 1.0], [bucket id: 4, min: "5", max: "5", ndv: 1.0, count: 1.0], [bucket id: 5, min: "6", max: "6", ndv: 1.0, count: 1.0]                                             │
└───────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘