Redis高效查询大数据的实践与优化详细指南

 更新时间:2025年04月10日 09:07:59   作者:码农阿豪@新空间  
Redis 是一种高性能的键值存储数据库,广泛应用于缓存,排行榜,计数器等场景,本文将围绕如何高效查询Redis中满足条件的数据展开讨论,感兴趣的小伙伴可以了解下

1. 引言

Redis 是一种高性能的键值存储数据库,广泛应用于缓存、排行榜、计数器等场景。在实际业务中,我们经常需要查询符合特定条件的数据,例如找出 value 大于某个阈值(如 10)的键值对。然而,直接遍历所有键并使用 GET 命令逐个检查可能会导致性能问题,尤其是当数据量较大时。

本文将围绕 如何高效查询 Redis 中满足条件的数据 展开讨论,从最初的简单实现到优化后的高效方案,并结合 Java 代码示例,帮助开发者掌握 Redis 数据查询的最佳实践。

2. 问题背景

假设我们有以下需求:

Redis 数据库 DB1(-n 1)存储了大量形如 flow:count:1743061930:* 的键。

需要找出其中 value > 10 的所有键值对,并统计总数。

初始实现方案

最初的 Shell 脚本如下:

redis-cli -h 10.206.0.16 -p 6379 -n 1 --scan --pattern "flow:count:1743061930:*" | \
while read key; do
  value=$(redis-cli -h 10.206.0.16 -p 6379 -n 1 GET "$key")
  if [ "$value" != "1" ]; then
    echo "$key: $value"
  fi
done | tee /dev/stderr | wc -l | awk '{print "Total count: " $1}'

该方案的问题:

多次 Redis 查询:每个键都要单独执行 GET,网络开销大。

Shell 字符串比较低效:[ "$value" != "1" ] 是字符串比较,数值比较更合适。

管道过多:tee、wc、awk 多个管道影响性能。

3. 优化方案

3.1 优化 Shell 脚本

优化后的版本:

redis-cli -h 10.206.0.16 -p 6379 -n 1 --scan --pattern "flow:count:1743061930:*" | \
while read key; do
  redis-cli -h 10.206.0.16 -p 6379 -n 1 GET "$key"
done | \
awk '$1 > 10 {count++; print} END {print "Total count: " count}'

优化点:

  • 减少 Redis 命令调用:直接批量获取 value,减少网络开销。
  • 使用 awk 进行数值比较:$1 > 10 比 Shell 字符串比较更高效。
  • 合并计数逻辑:awk 同时完成过滤、输出和计数。

如果仍需保留键名:

redis-cli -h 10.206.0.16 -p 6379 -n 1 --scan --pattern "flow:count:1743061930:*" | \
while read key; do
  value=$(redis-cli -h 10.206.0.16 -p 6379 -n 1 GET "$key")
  echo "$key: $value"
done | \
awk -F': ' '$2 > 10 {count++; print} END {print "Total count: " count}'

3.2 使用 Redis Pipeline 优化

Shell 脚本仍然存在多次 GET 的问题,我们可以使用 Redis Pipeline 批量获取数据,减少网络往返时间。

优化后的 Shell + Pipeline 方案

redis-cli -h 10.206.0.16 -p 6379 -n 1 --scan --pattern "flow:count:1743061930:*" | \
xargs -I {} redis-cli -h 10.206.0.16 -p 6379 -n 1 MGET {} | \
awk '$1 > 10 {count++; print} END {print "Total count: " count}'

这里使用 xargs + MGET 批量获取 value,减少网络请求次数。

4. Java 实现方案

在 Java 应用中,我们可以使用 Jedis 或 Lettuce 客户端优化查询。

4.1 使用 Jedis 查询

import redis.clients.jedis.Jedis;
import redis.clients.jedis.ScanParams;
import redis.clients.jedis.ScanResult;
import java.util.List;

public class RedisValueFilter {
    public static void main(String[] args) {
        String host = "10.206.0.16";
        int port = 6379;
        int db = 1;
        String pattern = "flow:count:1743061930:*";
        int threshold = 10;

        try (Jedis jedis = new Jedis(host, port)) {
            jedis.select(db);

            ScanParams scanParams = new ScanParams().match(pattern).count(100);
            String cursor = "0";
            int totalCount = 0;

            do {
                ScanResult<String> scanResult = jedis.scan(cursor, scanParams);
                List<String> keys = scanResult.getResult();
                cursor = scanResult.getCursor();

                // 批量获取 values
                List<String> values = jedis.mget(keys.toArray(new String[0]));

                // 过滤并统计
                for (int i = 0; i < keys.size(); i++) {
                    String key = keys.get(i);
                    String valueStr = values.get(i);
                    if (valueStr != null) {
                        int value = Integer.parseInt(valueStr);
                        if (value > threshold) {
                            System.out.println(key + ": " + value);
                            totalCount++;
                        }
                    }
                }
            } while (!cursor.equals("0"));

            System.out.println("Total count: " + totalCount);
        }
    }
}

优化点:

  • 使用 SCAN 代替 KEYS,避免阻塞 Redis。
  • 使用 MGET 批量查询,减少网络开销。
  • 直接数值比较,提高效率。

4.2 使用 Lettuce(异步非阻塞)

Lettuce 是高性能 Redis 客户端,支持异步查询:

import io.lettuce.core.*;
import io.lettuce.core.api.sync.RedisCommands;
import java.util.List;

public class RedisLettuceQuery {
    public static void main(String[] args) {
        RedisURI uri = RedisURI.create("redis://10.206.0.16:6379/1");
        RedisClient client = RedisClient.create(uri);

        try (RedisConnection<String, String> connection = client.connect()) {
            RedisCommands<String, String> commands = connection.sync();
            String pattern = "flow:count:1743061930:*";
            int threshold = 10;
            int totalCount = 0;

            ScanCursor cursor = ScanCursor.INITIAL;
            do {
                ScanArgs scanArgs = ScanArgs.Builder.matches(pattern).limit(100);
                KeyScanCursor<String> scanResult = commands.scan(cursor, scanArgs);
                List<String> keys = scanResult.getKeys();
                cursor = ScanCursor.of(scanResult.getCursor());

                // 批量获取 values
                List<KeyValue<String, String>> keyValues = commands.mget(keys.toArray(new String[0]));

                for (KeyValue<String, String> kv : keyValues) {
                    if (kv.hasValue()) {
                        int value = Integer.parseInt(kv.getValue());
                        if (value > threshold) {
                            System.out.println(kv.getKey() + ": " + value);
                            totalCount++;
                        }
                    }
                }
            } while (!cursor.isFinished());

            System.out.println("Total count: " + totalCount);
        } finally {
            client.shutdown();
        }
    }
}

优势:

非阻塞 I/O,适合高并发场景。

支持 Reactive 编程(如 RedisReactiveCommands)。

5. 性能对比

方案查询方式网络开销适用场景
原始 Shell单 GET 遍历少量数据
优化 Shell + awk批量 GET中等数据量
Shell + PipelineMGET 批量大数据量
Java + JedisSCAN + MGET生产环境
Java + Lettuce异步 SCAN最低高并发

6. 结论

  • 避免 KEYS 命令:使用 SCAN 替代,防止阻塞 Redis。
  • 减少网络请求:使用 MGET 或 Pipeline 批量查询。
  • 数值比较优化:用 awk 或 Java 直接比较数值,而非字符串。
  • 生产推荐:Java + Jedis/Lettuce 方案,适合大规模数据查询。

通过优化,我们可以显著提升 Redis 大数据查询的效率,降低服务器负载,适用于高并发生产环境。

到此这篇关于Redis高效查询大数据的实践与优化详细指南的文章就介绍到这了,更多相关Redis查询数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Redis 哨兵模式的实现详解

    Redis 哨兵模式的实现详解

    本文主要介绍了Redis 哨兵模式的实现详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-06-06
  • redis key命名规范的设计

    redis key命名规范的设计

    如果结构规划不合理、命令使用不规范,会造成系统性能达到瓶颈、活动高峰系统可用性下降,也会增大运维难度,本文主要介绍了redis key命名规范的设计,感兴趣的可以了解一下
    2024-03-03
  • Redis内部数据结构Dict的实现方法

    Redis内部数据结构Dict的实现方法

    这篇文章主要介绍了Redis内部数据结构Dict的实现方法,本篇文章所述的dict在Redis中最主要的作用就是用于维护Redis数据库中所有Key、value映射的数据结构,需要的朋友可以参考下
    2022-05-05
  • Redis中LFU算法的深入分析

    Redis中LFU算法的深入分析

    这篇文章主要给大家介绍了关于Redis中LFU算法的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Redis具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-06-06
  • Redis 哨兵机制及配置实现

    Redis 哨兵机制及配置实现

    本文主要介绍了Redis 哨兵机制及配置实现,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-03-03
  • redis+lua实现限流的项目实践

    redis+lua实现限流的项目实践

    redis有很多限流的算法(比如:令牌桶,计数器,时间窗口)等,在分布式里面进行限流的话,我们则可以使用redis+lua脚本进行限流,下面就来介绍一下redis+lua实现限流
    2023-10-10
  • Redis Sentinel服务配置流程(详解)

    Redis Sentinel服务配置流程(详解)

    下面小编就为大家带来一篇Redis Sentinel服务配置流程(详解)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-03-03
  • redis sentinel监控高可用集群实现的配置步骤

    redis sentinel监控高可用集群实现的配置步骤

    这篇文章主要介绍了redis sentinel监控高可用集群实现的配置步骤,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步早日升职加薪
    2022-04-04
  • redis集群搭建_动力节点Java学院整理

    redis集群搭建_动力节点Java学院整理

    这篇文章主要介绍了redis集群搭建,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-08-08
  • Redis如何实现数据库读写分离详解

    Redis如何实现数据库读写分离详解

    Redis的主从架构,能帮助我们实现读多,写少的情况,下面这篇文章主要给大家介绍了关于Redis如何实现数据库读写分离的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧。
    2018-03-03

最新评论