Go切片导致rand.Shuffle产生重复数据的原因与解决方案

 更新时间:2025年02月17日 09:09:40   作者:飞川001  
在 Go 语言的实际开发中,切片(slice)是一种非常灵活的数据结构,然而,由于其底层数据共享的特性,在某些情况下可能会导致意想不到的 Bug,本文将详细分析 rand.Shuffle 之后,切片中的数据出现重复的问题,探讨其根本原因,并给出最佳解决方案,需要的朋友可以参考下

问题描述

在一个 Go 服务端 API 里,我们需要按照 curBatch 参数进行分页,从 interestCfg 里分批选取 interestTagNum 个兴趣标签,并在返回结果前对选中的数据进行随机打乱。

全部兴趣标签示例:

{
    "InterestTags": [
        {"interestName":"Daily Sharing"},
        {"interestName":"Gaming"},
        {"interestName":"AI"},
        {"interestName":"test"},
        {"interestName":"Sports"},
        {"interestName":"Cars"},
        {"interestName":"other"}
    ]
}

现象回顾

当 curBatch = 0 时,返回的数据是正确的:

{
    "InterestTags": [
        { "interestName": "Daily Sharing" },
        { "interestName": "Gaming" },
        { "interestName": "AI" }
    ]
}

但当 curBatch = 2 时,测试环境出现了数据重复的问题:(本地运行正常)

1. 不随机时(正确的结果):

{
    "InterestTags": [
        { "interestName": "other" },
        { "interestName": "Daily Sharing" },
        { "interestName": "Gaming" }
    ]
}

2. 随机后(错误的结果):

{
    "InterestTags": [
        { "interestName": "Gaming" },
        { "interestName": "Gaming" },
        { "interestName": "AI" }
    ]
}

问题:

  • “Gaming” 出现了两次,而 “test” 消失了!
  • 本地环境正常,但测试环境异常,导致调试变得困难。

问题排查

数据的选择和随机操作逻辑如下:

interestTags := make([]model.InterestConfig, 0, interestConfig.InterestTagNum)

// 处理interestConfig,根据curBatch分批次处理
if len(interestConfig.InterestCfg) > 0 && interestConfig.InterestTagNum > 0 {
    interestAllTags := interestConfig.InterestCfg
    numBatches := (len(interestAllTags) + int(interestConfig.InterestTagNum) - 1) / int(interestConfig.InterestTagNum)
    startIdx := (curBatch % numBatches) * int(interestConfig.InterestTagNum)
    endIdx := startIdx + int(interestConfig.InterestTagNum)

    if endIdx > len(interestAllTags) {
        interestTags = interestAllTags[startIdx:]
        interestTags = append(interestTags, interestAllTags[:(endIdx-len(interestAllTags))]...)
    } else {
        interestTags = interestAllTags[startIdx:endIdx]
    }
}

// 随机打乱 interestTags 顺序
r := rand.New(rand.NewSource(time.Now().UnixNano()))
r.Shuffle(len(interestTags), func(i, j int) {
    interestTags[i], interestTags[j] = interestTags[j], interestTags[i]
})

关键点分析

  1. interestTags = interestAllTags[startIdx:endIdx] 直接从 interestAllTags 取出数据,但切片是引用类型,因此 interestTags 共享了 interestAllTags 的底层数组
  2. rand.Shuffle 随机交换 interestTags 里的元素,但 interestTags 指向 interestAllTags,可能导致原始数据被错误修改
  3. 本地和测试环境不一致,可能与 Go 运行时的内存管理机制高并发场景下的切片扩容行为有关。

代码验证

为了验证 interestTags 是否共享 interestAllTags 的底层数组,我们打印切片元素的内存地址:

fmt.Println("Before Shuffle:")
for i, tag := range interestTags {
    fmt.Printf("[%d] %p: %s\n", i, &interestTags[i], tag.InterestName)
}

r.Shuffle(len(interestTags), func(i, j int) {
    interestTags[i], interestTags[j] = interestTags[j], interestTags[i]
})

fmt.Println("After Shuffle:")
for i, tag := range interestTags {
    fmt.Printf("[%d] %p: %s\n", i, &interestTags[i], tag.InterestName)
}

解决方案

方案 1:使用 append 进行数据拷贝

为了避免 interestTags 共享 interestAllTags 的底层数组,我们需要显式拷贝数据:

interestTags = make([]model.InterestConfig, 0, interestConfig.InterestTagNum)
if endIdx > len(interestAllTags) {
    interestTags = append(interestTags, interestAllTags[startIdx:]...)
    interestTags = append(interestTags, interestAllTags[:(endIdx-len(interestAllTags))]...)
} else {
    interestTags = append(interestTags, interestAllTags[startIdx:endIdx]...)
}

为什么这样做?

  • append(..., interestAllTags[startIdx:endIdx]...) 创建新的切片,避免 interestTags 共享 interestAllTags 的底层数据。
  • 独立的数据拷贝 确保 rand.Shuffle 只影响 interestTags,不会破坏原始 interestAllTags

总结

1. 问题原因

  • Go 切片是引用类型,直接赋值 interestTags = interestAllTags[startIdx:endIdx] 不会创建新数据,而是共享底层数组
  • rand.Shuffle 可能影响 interestAllTags,导致元素重复
  • 本地环境正常,但测试环境异常,可能与 Go 内存管理切片扩容策略有关。

2. 解决方案

  • 使用 append 进行数据拷贝,确保 interestTags 是独立的数据,避免 rand.Shuffle 影响原始 interestAllTags

经验总结

  1. Go 切片是引用类型,不能直接赋值,否则可能共享底层数据。
  2. 使用 rand.Shuffle 之前,必须确保数据是独立的副本
  3. 尽量使用 append 创建新的切片,避免底层数组共享问题。
  4. 不同环境表现不一致时,应检查内存管理、并发情况及数据结构副作用。

以上就是Go切片导致rand.Shuffle产生重复数据的原因与解决方案的详细内容,更多关于Go rand.Shuffle产生重复数据的资料请关注脚本之家其它相关文章!

相关文章

  • Go设计模式之原型模式图文详解

    Go设计模式之原型模式图文详解

    原型模式是一种创建型设计模式, 使你能够复制已有对象, 而又无需使代码依赖它们所属的类,本文将通过图片和文字让大家可以详细的了解Go的原型模式,感兴趣的通过跟着小编一起来看看吧
    2023-07-07
  • go实现限流功能示例

    go实现限流功能示例

    这篇文章主要为大家介绍了go实现限流功能示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-08-08
  • golang读取http的body时遇到的坑及解决

    golang读取http的body时遇到的坑及解决

    这篇文章主要介绍了golang读取http的body时遇到的坑及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-03-03
  • golang http 连接超时和传输超时的例子

    golang http 连接超时和传输超时的例子

    今天小编就为大家分享一篇golang http 连接超时和传输超时的例子,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • Go方法接收者值接收者与指针接收者详解

    Go方法接收者值接收者与指针接收者详解

    这篇文章主要为大家介绍了Go方法接收者值接收者与指针接收者详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-11-11
  • 详解Go语言中用 os/exec 执行命令的五种方法

    详解Go语言中用 os/exec 执行命令的五种方法

    这篇文章主要介绍了Go语言中用 os/exec 执行命令的五种方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-11-11
  • Go语言学习之反射的用法详解

    Go语言学习之反射的用法详解

    反射指的是运行时动态的获取变量的相关信息。本文将为大家详细介绍Go语言中反射的用法,文中的示例代码讲解详细,感兴趣的可以了解一下
    2022-04-04
  • Go通过goroutine实现多协程文件上传的基本流程

    Go通过goroutine实现多协程文件上传的基本流程

    多协程文件上传是指利用多线程或多协程技术,同时上传一个或多个文件,以提高上传效率和速度,本文给大家介绍了Go通过goroutine实现多协程文件上传的基本流程,需要的朋友可以参考下
    2024-05-05
  • golang中如何使用kafka方法实例探究

    golang中如何使用kafka方法实例探究

    Kafka是一种备受欢迎的流处理平台,具备分布式、可扩展、高性能和可靠的特点,在处理Kafka数据时,有多种最佳实践可用来确保高效和可靠的处理,这篇文章将介绍golang中如何使用kafka方法
    2024-01-01
  • 以alpine作为基础镜像构建Golang可执行程序操作

    以alpine作为基础镜像构建Golang可执行程序操作

    这篇文章主要介绍了以alpine作为基础镜像构建Golang可执行程序操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-12-12

最新评论