高效查询Redis中大数据的实践与优化指南

news2025/4/19 7:07:15

个人名片
在这里插入图片描述
🎓作者简介:java领域优质创作者
🌐个人主页:码农阿豪
📞工作室:新空间代码工作室(提供各种软件服务)
💌个人邮箱:[2435024119@qq.com]
📱个人微信:15279484656
🌐个人导航网站:www.forff.top
💡座右铭:总有人要赢。为什么不能是我呢?

  • 专栏导航:

码农阿豪系列专栏导航
面试专栏:收集了java相关高频面试题,面试实战总结🍻🎉🖥️
Spring5系列专栏:整理了Spring5重要知识点与实战演练,有案例可直接使用🚀🔧💻
Redis专栏:Redis从零到一学习分享,经验总结,案例实战💐📝💡
全栈系列专栏:海纳百川有容乃大,可能你想要的东西里面都有🤸🌱🚀

目录

  • 高效查询Redis中大数据的实践与优化指南
    • 1. 引言
    • 2. 问题背景
      • 初始实现方案
    • 3. 优化方案
      • 3.1 优化 Shell 脚本
      • 3.2 使用 Redis Pipeline 优化
        • 优化后的 Shell + Pipeline 方案
    • 4. Java 实现方案
      • 4.1 使用 Jedis 查询
      • 4.2 使用 Lettuce(异步非阻塞)
    • 5. 性能对比
    • 6. 结论

高效查询Redis中大数据的实践与优化指南

1. 引言

Redis 是一种高性能的键值存储数据库,广泛应用于缓存、排行榜、计数器等场景。在实际业务中,我们经常需要查询符合特定条件的数据,例如找出 value 大于某个阈值(如 10)的键值对。然而,直接遍历所有键并使用 GET 命令逐个检查可能会导致性能问题,尤其是当数据量较大时。

本文将围绕 如何高效查询 Redis 中满足条件的数据 展开讨论,从最初的简单实现到优化后的高效方案,并结合 Java 代码示例,帮助开发者掌握 Redis 数据查询的最佳实践。


2. 问题背景

假设我们有以下需求:

  • Redis 数据库 DB1-n 1)存储了大量形如 flow:count:1743061930:* 的键。
  • 需要找出其中 value > 10 的所有键值对,并统计总数。

初始实现方案

最初的 Shell 脚本如下:

redis-cli -h 10.206.0.16 -p 6379 -n 1 --scan --pattern "flow:count:1743061930:*" | \
while read key; do
  value=$(redis-cli -h 10.206.0.16 -p 6379 -n 1 GET "$key")
  if [ "$value" != "1" ]; then
    echo "$key: $value"
  fi
done | tee /dev/stderr | wc -l | awk '{print "Total count: " $1}'

该方案的问题:

  1. 多次 Redis 查询:每个键都要单独执行 GET,网络开销大。
  2. Shell 字符串比较低效:[ "$value" != "1" ] 是字符串比较,数值比较更合适。
  3. 管道过多:teewcawk 多个管道影响性能。

3. 优化方案

3.1 优化 Shell 脚本

优化后的版本:

redis-cli -h 10.206.0.16 -p 6379 -n 1 --scan --pattern "flow:count:1743061930:*" | \
while read key; do
  redis-cli -h 10.206.0.16 -p 6379 -n 1 GET "$key"
done | \
awk '$1 > 10 {count++; print} END {print "Total count: " count}'

优化点:

  1. 减少 Redis 命令调用:直接批量获取 value,减少网络开销。
  2. 使用 awk 进行数值比较:$1 > 10 比 Shell 字符串比较更高效。
  3. 合并计数逻辑:awk 同时完成过滤、输出和计数。

如果仍需保留键名:

redis-cli -h 10.206.0.16 -p 6379 -n 1 --scan --pattern "flow:count:1743061930:*" | \
while read key; do
  value=$(redis-cli -h 10.206.0.16 -p 6379 -n 1 GET "$key")
  echo "$key: $value"
done | \
awk -F': ' '$2 > 10 {count++; print} END {print "Total count: " count}'

3.2 使用 Redis Pipeline 优化

Shell 脚本仍然存在多次 GET 的问题,我们可以使用 Redis Pipeline 批量获取数据,减少网络往返时间。

优化后的 Shell + Pipeline 方案
redis-cli -h 10.206.0.16 -p 6379 -n 1 --scan --pattern "flow:count:1743061930:*" | \
xargs -I {} redis-cli -h 10.206.0.16 -p 6379 -n 1 MGET {} | \
awk '$1 > 10 {count++; print} END {print "Total count: " count}'

这里使用 xargs + MGET 批量获取 value,减少网络请求次数。


4. Java 实现方案

在 Java 应用中,我们可以使用 Jedis 或 Lettuce 客户端优化查询。

4.1 使用 Jedis 查询

import redis.clients.jedis.Jedis;
import redis.clients.jedis.ScanParams;
import redis.clients.jedis.ScanResult;
import java.util.List;

public class RedisValueFilter {
    public static void main(String[] args) {
        String host = "10.206.0.16";
        int port = 6379;
        int db = 1;
        String pattern = "flow:count:1743061930:*";
        int threshold = 10;

        try (Jedis jedis = new Jedis(host, port)) {
            jedis.select(db);

            ScanParams scanParams = new ScanParams().match(pattern).count(100);
            String cursor = "0";
            int totalCount = 0;

            do {
                ScanResult<String> scanResult = jedis.scan(cursor, scanParams);
                List<String> keys = scanResult.getResult();
                cursor = scanResult.getCursor();

                // 批量获取 values
                List<String> values = jedis.mget(keys.toArray(new String[0]));

                // 过滤并统计
                for (int i = 0; i < keys.size(); i++) {
                    String key = keys.get(i);
                    String valueStr = values.get(i);
                    if (valueStr != null) {
                        int value = Integer.parseInt(valueStr);
                        if (value > threshold) {
                            System.out.println(key + ": " + value);
                            totalCount++;
                        }
                    }
                }
            } while (!cursor.equals("0"));

            System.out.println("Total count: " + totalCount);
        }
    }
}

优化点:

  • 使用 SCAN 代替 KEYS,避免阻塞 Redis。
  • 使用 MGET 批量查询,减少网络开销。
  • 直接数值比较,提高效率。

4.2 使用 Lettuce(异步非阻塞)

Lettuce 是高性能 Redis 客户端,支持异步查询:

import io.lettuce.core.*;
import io.lettuce.core.api.sync.RedisCommands;
import java.util.List;

public class RedisLettuceQuery {
    public static void main(String[] args) {
        RedisURI uri = RedisURI.create("redis://10.206.0.16:6379/1");
        RedisClient client = RedisClient.create(uri);

        try (RedisConnection<String, String> connection = client.connect()) {
            RedisCommands<String, String> commands = connection.sync();
            String pattern = "flow:count:1743061930:*";
            int threshold = 10;
            int totalCount = 0;

            ScanCursor cursor = ScanCursor.INITIAL;
            do {
                ScanArgs scanArgs = ScanArgs.Builder.matches(pattern).limit(100);
                KeyScanCursor<String> scanResult = commands.scan(cursor, scanArgs);
                List<String> keys = scanResult.getKeys();
                cursor = ScanCursor.of(scanResult.getCursor());

                // 批量获取 values
                List<KeyValue<String, String>> keyValues = commands.mget(keys.toArray(new String[0]));

                for (KeyValue<String, String> kv : keyValues) {
                    if (kv.hasValue()) {
                        int value = Integer.parseInt(kv.getValue());
                        if (value > threshold) {
                            System.out.println(kv.getKey() + ": " + value);
                            totalCount++;
                        }
                    }
                }
            } while (!cursor.isFinished());

            System.out.println("Total count: " + totalCount);
        } finally {
            client.shutdown();
        }
    }
}

优势:

  • 非阻塞 I/O,适合高并发场景。
  • 支持 Reactive 编程(如 RedisReactiveCommands)。

5. 性能对比

方案查询方式网络开销适用场景
原始 ShellGET 遍历少量数据
优化 Shell + awk批量 GET中等数据量
Shell + PipelineMGET 批量大数据量
Java + JedisSCAN + MGET生产环境
Java + Lettuce异步 SCAN最低高并发

6. 结论

  1. 避免 KEYS 命令:使用 SCAN 替代,防止阻塞 Redis。
  2. 减少网络请求:使用 MGET 或 Pipeline 批量查询。
  3. 数值比较优化:用 awk 或 Java 直接比较数值,而非字符串。
  4. 生产推荐:Java + Jedis/Lettuce 方案,适合大规模数据查询。

通过优化,我们可以显著提升 Redis 大数据查询的效率,降低服务器负载,适用于高并发生产环境。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2332944.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

操作系统 4.2-键盘

键盘中断初始化和处理 提取的代码如下&#xff1a; // con_init 函数&#xff0c;初始化控制台&#xff08;包括键盘&#xff09;的中断 void con_init(void) {set_trap_gate(0x21, &keyboard_interrupt); } ​ // 键盘中断处理函数 .globl _keyboard_interrupt _keyboard…

STM32+EC600E 4G模块 与华为云平台通信

前言 由于在STM32巡回研讨会上淘了一块EC600E4G模块以及刚办完电信卡多了两张副卡&#xff0c;副卡有流量刚好可以用一下&#xff0c;试想着以后画一块ESP32板子搭配这个4G模块做个随身WIFI&#xff0c;目前先用这个模块搭配STM32玩一下云平顺便记录一下。 实验目的 实现STM…

进行性核上性麻痹患者,饮食 “稳” 健康

进行性核上性麻痹作为一种复杂且罕见的神经系统退行性疾病&#xff0c;给患者的身体机能和日常生活带来严重挑战。在积极接受专业治疗的同时&#xff0c;合理的饮食安排对于维持患者营养状况、缓解症状及提升生活质量起着关键作用。以下为患者提供一些健康饮食建议。 首先&…

【数据结构 · 初阶】- 顺序表

目录 一、线性表 二、顺序表 1.实现动态顺序表 SeqList.h SeqList.c Test.c 问题 经验&#xff1a;free 出问题&#xff0c;2种可能性 解决问题 &#xff08;2&#xff09;尾删 &#xff08;3&#xff09;头插&#xff0c;头删 &#xff08;4&#xff09;在 pos 位…

NHANES指标推荐:aMED

文章题目&#xff1a;The moderating effect of alternate Mediterranean diet on the association between sedentary behavior and insomnia in postmenopausal women DOI&#xff1a;10.3389/fnut.2024.1516334 中文标题&#xff1a;替代性地中海饮食对绝经后女性久坐行为与…

Spring Cloud 远程调用

4.OpenFeign的实现原理是什么&#xff1f; 在使用OpenFeign的时候&#xff0c;主要关心两个注解&#xff0c;EnableFeignClients和FeignClient。整体的流程分为以下几个部分&#xff1a; 启用Feign代理&#xff0c;通过在启动类上添加EnableFeignClients注解&#xff0c;开启F…

力扣 — — 最长公共子序列

力扣 — — 最长公共子序列 最长公共子序列 题源&#xff1a;1143. 最长公共子序列 - 力扣&#xff08;LeetCode&#xff09; 题目&#xff1a; 分析&#xff1a; 一道经典的题目&#xff1a;最长公共子序列(LCS) 题目大意&#xff1a;求两个字符串的最长公共序列。 算法&…

当一个 HTTP 请求发往 Kubernetes(K8s)部署的微服务时,整个过程流转时怎样的?

以下是一个简单的示意图来展示这个过程&#xff1a; 1. 请求发起 客户端&#xff08;可以是浏览器、移动应用或者其他服务&#xff09;发起一个 HTTP 请求到目标微服务的地址。这个地址可以是服务的域名、IP 地址或者 Kubernetes 服务的 ClusterIP、NodePort 等。 2. 外部流量…

蓝桥杯-蓝桥幼儿园(Java-并查集)

并查集的核心思想 并查集主要由两个操作构成&#xff1a; Find&#xff1a;查找某个元素所在集合的根节点。并查集的特点是&#xff0c;每个元素都指向它自己的父节点&#xff0c;根节点的父节点指向它自己。查找过程中可以通过路径压缩来加速后续的查找操作&#xff0c;即将路…

C++蓝桥杯填空题(攻克版)

片头 嗨~小伙伴们&#xff0c;咱们继续攻克填空题&#xff0c;先把5分拿到手~ 第1题 数位递增的数 这道题&#xff0c;需要我们计算在整数 1 至 n 中有多少个数位递增的数。 什么是数位递增的数呢&#xff1f;一个正整数如果任何一个数位不大于右边相邻的数位。比如&#xf…

JS 构造函数实现封装性

通过构造函数实现封装性&#xff0c;构造函数生成的对象独立存在互不影响 创建实例对象时&#xff0c;其中函数的创建会浪费内存

一站式云分账系统!智能虚拟户分账系统成电商合规“刚需”

电商智能分账解决&#xff1a;电商一站式破解多平台资金管理难题集中管理分账&#xff0c;分账后秒到&#xff0c;并为针对电商行业三大核心痛点提供高效应对策略&#xff1a; 1. 票据合规困境 智能对接上下游交易数据流&#xff0c;构建自动化票据协同机制&#xff0c;有效规…

数组 array

1、数组定义 是一种用于存储多个相同类型数据的存储模型。 2、数组格式 &#xff08;1&#xff09;数据类型[ ] 变量名&#xff08;比较常见这种格式&#xff09; 例如&#xff1a; int [ ] arr0&#xff0c;定义了一个int类型的数组&#xff0c;数组名是arr0&#xff1b; &am…

linux命令六

逻辑卷 作用: 整合分散空间 空间支持扩大 步骤一:建立卷组&#xff08;VG&#xff09; 格式&#xff1a;vgcreate 卷组名 设备路径……. 如果分区不是卷组,则会先调用pvcreat 组建物理卷,再将其组建成组卷 Successfully:成功 example&#xff1a;例子 在man帮助中可以使用examp…

深度学习总结(8)

模型工作流程 模型由许多层链接在一起组成&#xff0c;并将输入数据映射为预测值。随后&#xff0c;损失函数将这些预测值与目标值进行比较&#xff0c;得到一个损失值&#xff0c;用于衡量模型预测值与预期结果之间的匹配程度。优化器将利用这个损失值来更新模型权重。 下面是…

基于docker搭建redis集群环境

在redis目录下创建redis-cluster目录&#xff0c;创建docker-compose.yml文化和generate.sh文件 【配置generate.sh文件】 for port in $(seq 1 9); \ do \ mkdir -p redis${port}/ touch redis${port}/redis.conf cat << EOF > redis${port}/redis.conf port 6379 …

分治-归并系列一>翻转对

目录 题目&#xff1a;解析&#xff1a;策略一&#xff1a; 代码&#xff1a;策略二&#xff1a; 代码&#xff1a; 题目&#xff1a; 链接: link 这题和逆序对区别点就是&#xff0c;要找到前一个元素是后一个元素的2倍 先找到目标值再&#xff0c;继续堆排序 解析&#xff1…

FFMPEG大文件视频分割传输教程,微信不支持1G文件以上

如下是一个2.77g的文件分割教程 . 前言 FFmpeg 是一个用于处理视频、音频等多媒体文件的开源工具包。它支持几乎所有的多媒体格式转换、剪辑和编辑&#xff0c;是开发者和多媒体工作者必备的工具。本文详细讲解如何在 Windows 系统上安装 FFmpeg 并进行基本配置。 2. 下载 FF…

MySQL5.7数据库部署和安装

1. 准备系统环境 Vmawre安装CentOS7 略… 2. 下载MySQL5.7安装包 下载地址&#xff1a; https://downloads.mysql.com/archives/get/p/23/file/mysql-5.7.38-linux-glibc2.12-x86_64.tar.gz 3. 卸载系统自带的MariaDB sudo yum remove $(rpm -qa | grep mariadb)4. 解压安…

Java学习手册:JVM、JRE和JDK的关系

在Java生态系统中&#xff0c;JVM&#xff08;Java虚拟机&#xff09;、JRE&#xff08;Java运行时环境&#xff09;和JDK&#xff08;Java开发工具包&#xff09;是三个核心概念。它们共同构成了Java语言运行和开发的基础。理解它们之间的关系对于Java开发者来说至关重要。本文…