Golang字符串拼接的性能以及原理详解

 更新时间:2023年06月09日 11:47:22   作者:Jeson-Sun  
最近在做性能优化,有个函数里面的耗时特别长,看里面的操作大多是一些字符串拼接的操作,而字符串拼接在golang里面其实有很多种实现,下面这篇文章主要给大家介绍了关于Golang字符串拼接的性能以及原理的相关资料,需要的朋友可以参考下

1.字符串高效拼接

在go语言中,字符串(string)是不可变的,因此字符串之间的拼接实际上是创建了一个新的字符串。如果频繁的进行字符串拼接,那将会对性能产生严重的影响!

1.1常见的拼接方式

(1)使用 +

func plusConcat(n int, str string) string {
	s := ""
	for i := 0; i < n; i++ {
		s += str
	}
	return s
}

(2)使用fmt.Sprintf

func sprintfConcat(n int, str string) string  {
	s := ""
	for i := 0; i < n; i++ {
		s = fmt.Sprintf("%s%s", s, str)
	}
	return s
}

(3) 使用strings.Builder

func builderConcat(n int, str string) string {
	var builder strings.Builder
	for i := 0; i < n; i++ {
		builder.WriteString(str)
	}
	return builder.String()
}

(4) 使用bytes.Buffer

func bufferConcat(n int, str string) string {
	buffer := new(bytes.Buffer)
	for i := 0; i < n; i++ {
		buffer.WriteString(str)
	}
	return buffer.String()
}

(5) 使用[] byte

func byteConcat(n int, str string) string {
	buf := make([]byte, 0, n*len(str))
	for i := 0; i < n; i++ {
		buf = append(buf, str...)
	}
	return string(buf)
}

1.2使用benchmark进行性能对比

测试代码:

const letterBytes = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"

func randomString(n int) string {
	b := make([]byte, n)
	for i := range b {
		b[i] = letterBytes[rand.Intn(len(letterBytes))]
	}
	return string(b)
}

func benchmark(b *testing.B, f func(int, string) string) {
	var str = randomString(10)
	for i := 0; i < b.N; i++ {
		f(10000, str)
	}
}

func BenchmarkPlusConcat(b *testing.B)    { benchmark(b, plusConcat) }
func BenchmarkSprintfConcat(b *testing.B) { benchmark(b, sprintfConcat) }
func BenchmarkBuilderConcat(b *testing.B) { benchmark(b, builderConcat) }
func BenchmarkBufferConcat(b *testing.B)  { benchmark(b, bufferConcat) }
func BenchmarkByteConcat(b *testing.B)    { benchmark(b, byteConcat) }

测试结果:

$ go test -bench="Concat$" -benchmem .
goos: darwin
goarch: amd64
pkg: example
BenchmarkPlusConcat-8         19      56 ms/op   530 MB/op   10026 allocs/op
BenchmarkSprintfConcat-8      10     112 ms/op   835 MB/op   37435 allocs/op
BenchmarkBuilderConcat-8    8901    0.13 ms/op   0.5 MB/op      23 allocs/op
BenchmarkBufferConcat-8     8130    0.14 ms/op   0.4 MB/op      13 allocs/op
BenchmarkByteConcat-8   17379    0.07 ms/op   0.2 MB/op       2 allocs/op
PASS
ok      example 8.627s

总结: 通过对比,发现fmt.sprintf()+的性能最低,和其他方法相比,性能低了差不多1000倍,且占用内存也比其他方法高了1000倍;而其他三者的性能和占用内存相差不多;性能最高的方法是[]byte,因为提前分配了足够的内存,所以拼接是不会进行字符串的拷贝与内存的重新分配,固效果最佳。

1.3字符串拼接最终建议

综合易用性和性能,一般推荐使用 strings.Builder 来拼接字符串。
官方解释:

A Builder is used to efficiently build a string using Write methods.
It minimizes memory copying.

如果对 strings.Builder 进行内存预分配,性能还可以再次提升。可以使用Grow()来对内存进行预分配。
如:

func builderConcat(n int, str string) string {
	var builder strings.Builder
	builer.Grow(n*len(str))
	for i := 0; i < n; i++ {
		builder.WriteString(str)
	}
	return builder.String()
}

2.性能背后的原理

2.1 比较 strings.Builder和 +

strings.Builder 和 + 性能和内存消耗差距如此巨大,是因为两者的内存分配方式不一样。

  • 字符串在 Go 语言中是不可变类型,占用内存大小是固定的,当使用 +拼接 2 个字符串时,生成一个新的字符串,那么就需要开辟一段新的空间,新空间的大小是原来两个字符串的大小之和。拼接第三个字符串时,再开辟一段新空间,新空间大小是三个字符串大小之和,以此类推。假设一个字符串大小为 10 byte,拼接 1w 次,需要申请的内存大小为:

10 + 2 * 10 + 3 * 10 + … + 10000 * 10 byte = 500 MB

  • strings.Builderbytes.Buffer,包括切片 []byte 的内存是以倍数申请的。例如,初始大小为 0,当第一次写入大小为 10 byte 的字符串时,则会申请大小为 16 byte 的内存(恰好大于 10 byte 的 2 的指数),第二次写入 10 byte 时,内存不够,则申请 32 byte 的内存,第三次写入内存足够,则不申请新的,以此类推。在实际过程中,超过一定大小,比如 2048 byte 后,申请策略上会有些许调整。

2.2 比较 strings.Builder 和 bytes.Buffer

strings.Builderbytes.Buffer 底层都是 []byte 数组,但 strings.Builder 性能比 bytes.Buffer 略快约 10% 。一个比较重要的区别在于,bytes.Buffer转化为字符串时重新申请了一块空间,存放生成的字符串变量,而 strings.Builder 直接将底层的[]byte转换成了字符串类型返回了回来。

总结

到此这篇关于Golang字符串拼接的性能以及原理详解的文章就介绍到这了,更多相关Golang字符串拼接性能内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 基于golang uint8、int8与byte的区别说明

    基于golang uint8、int8与byte的区别说明

    这篇文章主要介绍了基于golang uint8、int8与byte的区别说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • 详解Golang中文件系统事件监听

    详解Golang中文件系统事件监听

    文件系统事件是指文件系统相关的各种操作和状态变化,当一个应用层的进程操作文件或目录时,会触发system call,内核的notification子系统可以守在那里,把该进程对文件的操作上报给应用层的监听进程,这篇文章主要介绍了Golang之文件系统事件监听,需要的朋友可以参考下
    2024-01-01
  • Go垃圾回收提升内存管理效率优化最佳实践

    Go垃圾回收提升内存管理效率优化最佳实践

    这篇文章主要为大家介绍了Go垃圾回收提升内存管理效率优化最佳实践,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-12-12
  • golang 中获取字符串个数的方法

    golang 中获取字符串个数的方法

    这篇文章主要介绍了golang 中获取字符串个数 ,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-08-08
  • golang xorm 自定义日志记录器之使用zap实现日志输出、切割日志(最新)

    golang xorm 自定义日志记录器之使用zap实现日志输出、切割日志(最新)

    这篇文章主要介绍了golang xorm 自定义日志记录器,使用zap实现日志输出、切割日志,包括连接postgresql数据库的操作方法及 zap日志工具 ,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-10-10
  • Go Excelize API源码阅读SetSheetViewOptions示例解析

    Go Excelize API源码阅读SetSheetViewOptions示例解析

    这篇文章主要为大家介绍了Go-Excelize API源码阅读SetSheetViewOptions示例解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-08-08
  • Goland中Protobuf的安装、配置和使用

    Goland中Protobuf的安装、配置和使用

    本文记录了mac环境下protobuf的编译安装,并通过一个示例来演示proto自动生成go代码,本文使用的mac os 12.3系统,不建议使用homebrew安装,系统版本太高,会安装报错,所以自己下载新版压缩包编译构建安装
    2022-05-05
  • Golang中的new()和make()函数本质区别

    Golang中的new()和make()函数本质区别

    在 Go 语言开发中,new() 和 make() 是两个容易让开发者感到困惑的内建函数,尽管它们都用于内存分配,但其设计目的、适用场景和底层实现存在本质差异,本文将通过类型系统、内存模型和编译器实现三个维度,深入解析这两个函数的本质区别,感兴趣的朋友一起看看吧
    2025-02-02
  • 深入理解gorm如何和数据库建立连接

    深入理解gorm如何和数据库建立连接

    这篇文章主要为大家详细介绍了gorm如何和数据库建立连接,文中的示例代码讲解详细,对我们深入了解GO语言有一定的帮助,需要的小伙伴可以参考下
    2023-11-11
  • 如何通过Golang的container/list实现LRU缓存算法

    如何通过Golang的container/list实现LRU缓存算法

    文章介绍了Go语言中container/list包实现的双向链表,并探讨了如何使用链表实现LRU缓存,LRU缓存通过维护一个双向链表来管理数据,确保在插入和删除操作时能够以O(1)的平均时间复杂度运行,提供了链表的操作和使用场景,并附带了实现LRU缓存的代码示例,感兴趣的朋友一起看看吧
    2025-03-03

最新评论