浅析Golang中rune类型的使用

 更新时间:2023年05月17日 17:08:10   作者:人艰不拆_zmc  
从golang源码中看出,rune关键字是int32的别名(-231~231-1),对比byte(-128~127),可表示的字符更多,本文就来简单聊聊它的使用方法吧,希望对大家有所帮助

1、概述

经常在开源库中看到rune关键字,从golang源码中看出,它是int32的别名(-231~231-1),对比byte(-128~127),可表示的字符更多。

2、使用

由于rune可表示的范围更大,所以能处理一切字符,当然也包括中文字符。在平时计算中文字符,可用rune。

查询官方的解释如下:

// rune is an alias for int32 and is equivalent to int32 in all ways. It is
// used, by convention, to distinguish character values from integer values.
 
//int32的别名,几乎在所有方面等同于int32
//它用来区分字符值和整数值
 
type rune = int32

这样可能还是对rune的作用与意义比较懵逼,我们通过两个简单的示例来看下rune的作用。

示例一:

package main
 
import "fmt"
 
func main() {
 
    var str = "hello 你好"
    fmt.Println("len(str):", len(str))
 
}

输出:

//输出,注意在golang中一个汉字占3个byte
len(str): 12

golang中string底层是通过byte数组实现的。中文字符在unicode下占2个字节,在utf-8编码下占3个字节,而golang默认编码正好是utf-8。

那么?如果我们预期想得到一个字符串的长度,而不是字符串底层占得字节长度,该怎么办呢???

package main
 
import (
    "fmt"
    "unicode/utf8"
)
 
func main() {
 
    var str = "hello 你好"
 
    //golang中string底层是通过byte数组实现的,直接求len 实际是在按字节长度计算  所以一个汉字占3个字节算了3个长度
    fmt.Println("len(str):", len(str))
     
    //以下两种都可以得到str的字符串长度
     
    //golang中的unicode/utf8包提供了用utf-8获取长度的方法
    fmt.Println("RuneCountInString:", utf8.RuneCountInString(str))
 
    //通过rune类型处理unicode字符
    fmt.Println("rune:", len([]rune(str)))
}

输出:

len(str): 12
RuneCountInString: 8
rune: 8

示例二:

package main
 
import "fmt"
 
func main() {
    s := "abc你好"
    r := "123你好"
    fmt.Println("len(s)=", len([]byte(s)), "len(r)=", len([]rune(r))) //len(s)= 9 len(r)= 5
 
    for k, v := range r {
        fmt.Println("k=", k, "v=", v)
    }
 
    for k, v := range []rune(r) {
        fmt.Println("k2=", k, "v2=", v)
    }
}

用range遍历包含中文的字符串时,会发现第一个for中k的值为0,1,2,3,6;第二个for中k的值为0,1,2,3,4;说明字符串中如果包含中文,range的时候可以识别出来,一个中文占用3个byte,索引就自动加三;而rune索引则只会加一。 

3、总结

golang中string底层是通过byte数组实现的。中文字符在unicode下占2个字节,在utf-8编码下占3个字节,golang默认编码是utf-8。如果想得到字符串真正的长度(一个中文算一位),需要将字符串转换为rune,再求长度。

golang中byte数据类型与rune相似,它们都是用来表示字符类型的变量类型。它们的不同在于:

  • byte 等同于int8,常用来处理ascii字符
  • rune 等同于int32,常用来处理unicode或utf-8字符

到此这篇关于浅析Golang中rune类型的使用的文章就介绍到这了,更多相关Golang rune类型内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:

相关文章

  • 深入了解GoLang中的工厂设计模式

    深入了解GoLang中的工厂设计模式

    这篇文章主要介绍了深入了解GoLang中的工厂设计模式,工厂模式是一种常用的设计模式,它属于创建型模式,它的主要目的是封装对象的创建过程,将对象的创建过程与对象的使用过程分离,从而提高代码的可维护性和可扩展性,需要详细了解可以参考下文
    2023-05-05
  • golang cobra使用chatgpt qdrant实现ai知识库

    golang cobra使用chatgpt qdrant实现ai知识库

    这篇文章主要为大家介绍了golang cobra使用chatgpt qdrant实现ai知识库,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-09-09
  • go语言中排序sort的使用方法示例

    go语言中排序sort的使用方法示例

    golang中也实现了排序算法的包sort包,下面这篇文章就来给大家介绍了关于go语言中排序sort的使用方法,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧
    2018-06-06
  • 详解为什么说Golang中的字符串类型不能修改

    详解为什么说Golang中的字符串类型不能修改

    在接触Go这么语言,可能你经常会听到这样一句话。对于字符串不能修改,可能你很纳闷,日常开发中我们对字符串进行修改也是很正常的,为什么又说Go中的字符串不能进行修改呢?本文就来通过实际案例给大家演示一下
    2023-03-03
  • Golang实现web文件共享服务的示例代码

    Golang实现web文件共享服务的示例代码

    这篇文章主要介绍了Golang实现web文件共享服务的示例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-10-10
  • go语言使用range来接收通道里面的数据

    go语言使用range来接收通道里面的数据

    本文主要介绍了go语言使用range来接收通道里面的数据,for ... range 循环会一直从通道中接收值,直到通道关闭并且所有值都被接收完毕,下面就来介绍一下,感兴趣的可以了解一下
    2025-04-04
  • golang接口实现调用修改(值接收者指针接收者)场景详解

    golang接口实现调用修改(值接收者指针接收者)场景详解

    这篇文章主要为大家介绍了golang接口实现调用修改值接收者指针接收者示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-08-08
  • Goland使用delve进行远程调试的详细教程

    Goland使用delve进行远程调试的详细教程

    网上给出的使用delve进行远程调试,都需要先在本地交叉编译或者在远程主机上编译出可运行的程序,然后再用delve在远程启动程序,本教程会将上面的步骤简化为只需要两步,1,在远程运行程序2,在本地启动调试,需要的朋友可以参考下
    2024-08-08
  • GO语言打包成.exe程序的方法

    GO语言打包成.exe程序的方法

    Go语言以其高效的编译能力和简洁的语法,能够轻松打包生成Windows系统下的.exe可执行文件,用户只需安装Go编译器、编写Go源代码并使用gobuild命令指定输出文件名即可完成编译,感兴趣的可以了解一下
    2024-10-10
  • golang基于errgroup实现并发调用的方法

    golang基于errgroup实现并发调用的方法

    这篇文章主要介绍了golang基于errgroup实现并发调用,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-09-09

最新评论