个人名片
🎓作者简介:java领域优质创作者
🌐个人主页:码农阿豪
📞工作室:新空间代码工作室(提供各种软件服务)
💌个人邮箱:[2435024119@qq.com]
📱个人微信:15279484656
🌐个人导航网站:www.forff.top
💡座右铭:总有人要赢。为什么不能是我呢?
- 专栏导航:
码农阿豪系列专栏导航
面试专栏:收集了java相关高频面试题,面试实战总结🍻🎉🖥️
Spring5系列专栏:整理了Spring5重要知识点与实战演练,有案例可直接使用🚀🔧💻
Redis专栏:Redis从零到一学习分享,经验总结,案例实战💐📝💡
全栈系列专栏:海纳百川有容乃大,可能你想要的东西里面都有🤸🌱🚀
目录
- 高效查询Redis中大数据的实践与优化指南
- 1. 引言
- 2. 问题背景
- 初始实现方案
- 3. 优化方案
- 3.1 优化 Shell 脚本
- 3.2 使用 Redis Pipeline 优化
- 优化后的 Shell + Pipeline 方案
- 4. Java 实现方案
- 4.1 使用 Jedis 查询
- 4.2 使用 Lettuce(异步非阻塞)
- 5. 性能对比
- 6. 结论
高效查询Redis中大数据的实践与优化指南
1. 引言
Redis 是一种高性能的键值存储数据库,广泛应用于缓存、排行榜、计数器等场景。在实际业务中,我们经常需要查询符合特定条件的数据,例如找出 value
大于某个阈值(如 10)的键值对。然而,直接遍历所有键并使用 GET
命令逐个检查可能会导致性能问题,尤其是当数据量较大时。
本文将围绕 如何高效查询 Redis 中满足条件的数据 展开讨论,从最初的简单实现到优化后的高效方案,并结合 Java 代码示例,帮助开发者掌握 Redis 数据查询的最佳实践。
2. 问题背景
假设我们有以下需求:
- Redis 数据库
DB1
(-n 1
)存储了大量形如flow:count:1743061930:*
的键。 - 需要找出其中
value > 10
的所有键值对,并统计总数。
初始实现方案
最初的 Shell 脚本如下:
redis-cli -h 10.206.0.16 -p 6379 -n 1 --scan --pattern "flow:count:1743061930:*" | \
while read key; do
value=$(redis-cli -h 10.206.0.16 -p 6379 -n 1 GET "$key")
if [ "$value" != "1" ]; then
echo "$key: $value"
fi
done | tee /dev/stderr | wc -l | awk '{print "Total count: " $1}'
该方案的问题:
- 多次 Redis 查询:每个键都要单独执行
GET
,网络开销大。 - Shell 字符串比较低效:
[ "$value" != "1" ]
是字符串比较,数值比较更合适。 - 管道过多:
tee
、wc
、awk
多个管道影响性能。
3. 优化方案
3.1 优化 Shell 脚本
优化后的版本:
redis-cli -h 10.206.0.16 -p 6379 -n 1 --scan --pattern "flow:count:1743061930:*" | \
while read key; do
redis-cli -h 10.206.0.16 -p 6379 -n 1 GET "$key"
done | \
awk '$1 > 10 {count++; print} END {print "Total count: " count}'
优化点:
- 减少 Redis 命令调用:直接批量获取
value
,减少网络开销。 - 使用
awk
进行数值比较:$1 > 10
比 Shell 字符串比较更高效。 - 合并计数逻辑:
awk
同时完成过滤、输出和计数。
如果仍需保留键名:
redis-cli -h 10.206.0.16 -p 6379 -n 1 --scan --pattern "flow:count:1743061930:*" | \
while read key; do
value=$(redis-cli -h 10.206.0.16 -p 6379 -n 1 GET "$key")
echo "$key: $value"
done | \
awk -F': ' '$2 > 10 {count++; print} END {print "Total count: " count}'
3.2 使用 Redis Pipeline 优化
Shell 脚本仍然存在多次 GET
的问题,我们可以使用 Redis Pipeline 批量获取数据,减少网络往返时间。
优化后的 Shell + Pipeline 方案
redis-cli -h 10.206.0.16 -p 6379 -n 1 --scan --pattern "flow:count:1743061930:*" | \
xargs -I {} redis-cli -h 10.206.0.16 -p 6379 -n 1 MGET {} | \
awk '$1 > 10 {count++; print} END {print "Total count: " count}'
这里使用 xargs
+ MGET
批量获取 value
,减少网络请求次数。
4. Java 实现方案
在 Java 应用中,我们可以使用 Jedis 或 Lettuce 客户端优化查询。
4.1 使用 Jedis 查询
import redis.clients.jedis.Jedis;
import redis.clients.jedis.ScanParams;
import redis.clients.jedis.ScanResult;
import java.util.List;
public class RedisValueFilter {
public static void main(String[] args) {
String host = "10.206.0.16";
int port = 6379;
int db = 1;
String pattern = "flow:count:1743061930:*";
int threshold = 10;
try (Jedis jedis = new Jedis(host, port)) {
jedis.select(db);
ScanParams scanParams = new ScanParams().match(pattern).count(100);
String cursor = "0";
int totalCount = 0;
do {
ScanResult<String> scanResult = jedis.scan(cursor, scanParams);
List<String> keys = scanResult.getResult();
cursor = scanResult.getCursor();
// 批量获取 values
List<String> values = jedis.mget(keys.toArray(new String[0]));
// 过滤并统计
for (int i = 0; i < keys.size(); i++) {
String key = keys.get(i);
String valueStr = values.get(i);
if (valueStr != null) {
int value = Integer.parseInt(valueStr);
if (value > threshold) {
System.out.println(key + ": " + value);
totalCount++;
}
}
}
} while (!cursor.equals("0"));
System.out.println("Total count: " + totalCount);
}
}
}
优化点:
- 使用
SCAN
代替KEYS
,避免阻塞 Redis。 - 使用
MGET
批量查询,减少网络开销。 - 直接数值比较,提高效率。
4.2 使用 Lettuce(异步非阻塞)
Lettuce 是高性能 Redis 客户端,支持异步查询:
import io.lettuce.core.*;
import io.lettuce.core.api.sync.RedisCommands;
import java.util.List;
public class RedisLettuceQuery {
public static void main(String[] args) {
RedisURI uri = RedisURI.create("redis://10.206.0.16:6379/1");
RedisClient client = RedisClient.create(uri);
try (RedisConnection<String, String> connection = client.connect()) {
RedisCommands<String, String> commands = connection.sync();
String pattern = "flow:count:1743061930:*";
int threshold = 10;
int totalCount = 0;
ScanCursor cursor = ScanCursor.INITIAL;
do {
ScanArgs scanArgs = ScanArgs.Builder.matches(pattern).limit(100);
KeyScanCursor<String> scanResult = commands.scan(cursor, scanArgs);
List<String> keys = scanResult.getKeys();
cursor = ScanCursor.of(scanResult.getCursor());
// 批量获取 values
List<KeyValue<String, String>> keyValues = commands.mget(keys.toArray(new String[0]));
for (KeyValue<String, String> kv : keyValues) {
if (kv.hasValue()) {
int value = Integer.parseInt(kv.getValue());
if (value > threshold) {
System.out.println(kv.getKey() + ": " + value);
totalCount++;
}
}
}
} while (!cursor.isFinished());
System.out.println("Total count: " + totalCount);
} finally {
client.shutdown();
}
}
}
优势:
- 非阻塞 I/O,适合高并发场景。
- 支持 Reactive 编程(如
RedisReactiveCommands
)。
5. 性能对比
方案 | 查询方式 | 网络开销 | 适用场景 |
---|---|---|---|
原始 Shell | 单 GET 遍历 | 高 | 少量数据 |
优化 Shell + awk | 批量 GET | 中 | 中等数据量 |
Shell + Pipeline | MGET 批量 | 低 | 大数据量 |
Java + Jedis | SCAN + MGET | 低 | 生产环境 |
Java + Lettuce | 异步 SCAN | 最低 | 高并发 |
6. 结论
- 避免
KEYS
命令:使用SCAN
替代,防止阻塞 Redis。 - 减少网络请求:使用
MGET
或 Pipeline 批量查询。 - 数值比较优化:用
awk
或 Java 直接比较数值,而非字符串。 - 生产推荐:Java + Jedis/Lettuce 方案,适合大规模数据查询。
通过优化,我们可以显著提升 Redis 大数据查询的效率,降低服务器负载,适用于高并发生产环境。