Rust语言中级教程之指针

 更新时间:2023年05月06日 16:09:37   作者:QIAOPENGJUN  
Rust中共有三种类型的指针,分别为引用,解引用,智能指针,这篇文章主要介绍了Rust语言中级教程之指针,需要的朋友可以参考下

Rust语言中级教程

一、指针

什么是指针

  • 指针是计算机引用无法立即直接访问的数据的一种方式(类比 书的目录)
  • 数据在物理内存(RAM)中是分散的存储着
  • 地址空间是检索系统
  • 指针就被编码为内存地址,使用 usize 类型的整数表示。
    • 一个地址就会指向地址空间中的某个地方
  • 地址空间的范围是 OS 和 CPU 提供的外观界面
    • 程序只知道有序的字节序列,不会考虑系统中实际 RAM 的数量

名词解释

  • 内存地址(地址),就是指代内存中单个字节的一个数
    • 内存地址是汇编语言提供的抽象
  • 指针(有时扩展称为原始指针),就是指向某种类型的一个内存地址
    • 指针是高级语言提供的抽象
  • 引用,就是指针。如果是动态大小的类型,就是指针和具有额外保证的一个整数
    • 引用是 Rust 提供的抽象

Rust 的引用

  • 引用始终引用的是有效数据
  • 引用与 usize 的倍数对齐
  • 引用可以为动态大小的类型提供上述保障

Rust 的引用 和 指针

static B: [u8; 10] = [99, 97, 114, 114, 121, 116, 111, 119, 101, 108];
static C: [u8; 11] = [116, 104, 97, 110, 107, 115, 102, 105, 115, 104, 0];
fn main() {
    let a = 42;
    let b = &B;
    let c = &C;
    println!("a: {}, b: {:p}, c: {:p}", a, b, c);
}

运行

point_demo on  master [?] is 📦 0.1.0 via 🦀 1.67.1 via 🅒 base 
➜ cargo run           
   Compiling point_demo v0.1.0 (/Users/qiaopengjun/rust/point_demo)
    Finished dev [unoptimized + debuginfo] target(s) in 0.44s
     Running `target/debug/point_demo`
a: 42, b: 0x1023dc660, c: 0x1023dc66a

point_demo on  master [?] is 📦 0.1.0 via 🦀 1.67.1 via 🅒 base 
➜ 

  • 一个更加逼真的例子
    • 使用更复杂的类型展示指针内部的区别
use std::mem::size_of;
static B: [u8; 10] = [99, 97, 114, 114, 121, 116, 111, 119, 101, 108];
static C: [u8; 11] = [116, 104, 97, 110, 107, 115, 102, 105, 115, 104, 0];
fn main() {
    // let a = 42;
    // let b = &B;
    // let c = &C;
    // println!("a: {}, b: {:p}, c: {:p}", a, b, c);
    let a: usize = 42;
    let b: Box<[u8]> = Box::new(B);
    let c: &[u8; 11] = &C;
    println!("a (unsigned 整数):");
    println!("  地址: {:p}", &a);
    println!("  大小:    {:?} bytes", size_of::<usize>());
    println!("  值:  {:?}\n", a);
    println!("b (B 装在 Box 里):");
    println!("  地址:  {:p}", &b);
    println!("  大小:    {:?} bytes", size_of::<Box<[u8]>>());
    println!("  指向:  {:p}\n", b);
    println!("c (C 的引用):");
    println!("  地址:  {:p}", &c);
    println!("  大小:  {:?} bytes", size_of::<&[u8; 11]>());
    println!("  指向:  {:p}\n", c);
    println!("B (10 bytes 的数组):");
    println!("  地址:  {:p}", &B);
    println!("  大小:  {:?} bytes", size_of::<[u8; 10]>());
    println!("  值:  {:?}\n", B);
    println!("C (11 bytes 的数字):");
    println!("  地址:  {:p}", &C);
    println!("  大小:  {:?} bytes", size_of::<[u8; 11]>());
    println!("  值:  {:?}\n", C);
}

运行

point_demo on  master [?] is 📦 0.1.0 via 🦀 1.67.1 via 🅒 base 
➜ cargo run
   Compiling point_demo v0.1.0 (/Users/qiaopengjun/rust/point_demo)
    Finished dev [unoptimized + debuginfo] target(s) in 0.19s
     Running `target/debug/point_demo`
a (unsigned 整数):
  地址: 0x16dda9a08
  大小:    8 bytes
  值:  42

b (B 装在 Box 里):
  地址:  0x16dda9a10
  大小:    16 bytes
  指向:  0x12b606ba0

c (C 的引用):
  地址:  0x16dda9a30
  大小:  8 bytes
  指向:  0x10208d7ba

B (10 bytes 的数组):
  地址:  0x10208d7b0
  大小:  10 bytes
  值:  [99, 97, 114, 114, 121, 116, 111, 119, 101, 108]

C (11 bytes 的数字):
  地址:  0x10208d7ba
  大小:  11 bytes
  值:  [116, 104, 97, 110, 107, 115, 102, 105, 115, 104, 0]

point_demo on  master [?] is 📦 0.1.0 via 🦀 1.67.1 via 🅒 base 
➜ 

  • 对 B 和 C 中文本进行解码的例子
    • 它创建了一个与前图更加相似的内存地址布局
use std::borrow::Cow;
use std::ffi::CStr;
use std::os::raw::c_char;
static B: [u8; 10] = [99, 97, 114, 114, 121, 116, 111, 119, 101, 108];
static C: [u8; 11] = [116, 104, 97, 110, 107, 115, 102, 105, 115, 104, 0];
fn main() {
  let a = 42;
  let b: String;
  let c: Cow<str>;
  unsafe {
    let b_ptr = &B as * const u8 as *mut u8;
    b = String::from_raw_parts(b_ptr, 10, 10);
    let c_ptr = &C as *const u8 as *const c_char;
    c = CStr::from_ptr(c_ptr).to_string_lossy();
  }
  println!("a: {}, b: {}, c: {}", a, b, c);
}

Raw Pointers(原始指针)

  • Raw Pointer (原始指针)是没有 Rust 标准保障的内存地址。
    • 这些本质上是 unsafe 的
  • 语法:
    • 不可变 Raw Pointer:*const T
    • 可变的 Raw Pointer:*mut T
    • 注意:*const T,这三个标记放在一起表示的是一个类型
    • 例子:*const String
  • *const T 与 *mut T 之间的差异很小,相互可以自由转换
  • Rust 的引用(&mut T 和 &T)会编译为原始指针
    • 这意味着无需冒险进入 unsafe 块,就可以获得原始指针的性能
  • 例子:把引用转为原始指针
fn main() {
  let a: i64 = 42;
  let a_ptr = &a as *const i64;
  println!("a: {} ({:p})", a, a_ptr);
}
  • 解引用(dereference):通过指针从 RAM 内存提取数据的过程叫做对指针进行解引用(dereferencing a pointer)
  • 例子:把引用转为原始指针
fn main() {
  let a: i64 = 42;
  let a_ptr = &a as *const i64;
  let a_addr: usize = unsafe {std::mem::transmute(a_ptr)};
  println!("a: {} ({:p}...0x{:x})", a, a_ptr, a_addr + 7);
}

关于 Raw Pointer 的提醒

  • 在底层,引用(&T 和 &mutT)被实现为原始指针。但引用带有额外的保障,应该始终作为首选使用
  • 访问 Raw Pointer 的值总是 unsafe 的
  • Raw Pointer 不拥有值的所有权
    • 在访问时编译器不会检查数据的合法性
  • 允许多个 Raw Pointer 指向同一数据
    • Rust 无法保证共享数据的合法性

使用 Raw Pointer 的情况

  • 不可避免
    • 某些 OS 或 第三方库需要使用,例如与C交互
  • 共享对某些内容的访问至关重要,运行时性能要求高

Rust 指针生态

  • Raw Pointer 是 unsafe 的
  • Smart Pointer(智能指针)倾向于包装原始指针,附加更多的能力
    • 不仅仅是对内存地址解引用

Rust 智能指针

名称简介强项弱项
Raw Pointer*mut T 和 *const T,自由基,闪电般块,极其 Unsafe速度、与外界交互Unsafe
Box<T>可把任何东西都放在Box里。可接受几乎任何类型的长期存储。新的安全编程时代的主力军。将值集中存储在 Heap大小增加
Rc<T>是Rust的能干而吝啬的簿记员。它知道谁借了什么,何时借了什么对值的共享访问大小增加;运行时成本;线程不安全
Arc<T>是Rust的大使。它可以跨线程共享值,保证这些值不会相互干扰对值的共享访问;线程安全大小增加;运行时成本
Cell<T>变态专家,具有改变不可变值的能力内部可变性大小增加;性能
RefCell<T>对不可变引用执行改变,但有代价内部可变性;可与仅接受不可变引用的Rc、Arc嵌套使用大小增加;运行时成本;缺乏编译时保障
Cow<T>封闭并提供对借用数据的不可变访问,并在需要修改或所有权时延迟克隆数据当只是只读访问时避免写入大小可能会增大
String可处理可变长度的文本,展示了如何构建安全的抽象动态按需增长;在运行时保证正确编码过度分配内存大小
Vec<T>程序最常用的存储系统;它在创建和销毁值时保持数据有序动态按需增长过度分配内存大小
RawVec<T>Vec<T>和其它动态大小类型的基石;知道如何按需给你的数据提供一个家动态按需增长;与内存分配器一起配合寻找空间不直接适用于您的代码
Unique<T>作为值的唯一所有者,可保证拥有完全控制权需要独占值的类型(如 String)的基础不适合直接用于应用程序代码
Shared<T>分享所有权很难,但他使生活更轻松共享所有权;可以将内存与T的宽度对齐,即使是空的时候不适合直接用于应用程序代码

到此这篇关于Rust语言中级教程之指针的文章就介绍到这了,更多相关Rust指针内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • RUST语言函数的定义与调用方法

    RUST语言函数的定义与调用方法

    定义一个RUST函数使用fn关键字,下面通过本文给大家介绍RUST语言函数的定义与调用方法,感兴趣的朋友跟随小编一起看看吧
    2024-04-04
  • 一文弄懂rust生命周期

    一文弄懂rust生命周期

    生命周期是Rust语言中的一个概念,用于决内存安全问题,本文主要介绍了一文弄懂rust生命周期,具有一定的参考价值,感兴趣的可以了解一下
    2023-12-12
  • Rust如何进行模块化开发技巧分享

    Rust如何进行模块化开发技巧分享

    Rust模块化,模块化有助于代码的管理和层次逻辑的清晰,本文主要介绍了Rust如何进行模块化开发,结合实例代码给大家讲解的非常详细,需要的朋友可以参考下
    2023-01-01
  • Rust 中的文件操作示例详解

    Rust 中的文件操作示例详解

    Rust 中的路径操作是跨平台的,std::path 模块提供的了两个用于描述路径的类型,本文给大家介绍Rust 中的文件操作示例详解,感兴趣的朋友一起看看吧
    2021-11-11
  • Rust并发编程之使用消息传递进行线程间数据共享方式

    Rust并发编程之使用消息传递进行线程间数据共享方式

    文章介绍了Rust中的通道(channel)概念,包括通道的基本概念、创建并使用通道、通道与所有权、发送多个消息以及多发送端,通道提供了一种线程间安全的通信机制,通过所有权规则确保数据安全,并且支持多生产者单消费者架构
    2025-02-02
  • 详解Rust编程中的共享状态并发执行

    详解Rust编程中的共享状态并发执行

    虽然消息传递是一个很好的处理并发的方式,但并不是唯一一个,另一种方式是让多个线程拥有相同的共享数据,本文给大家介绍Rust编程中的共享状态并发执行,感兴趣的朋友一起看看吧
    2023-11-11
  • 详解Rust中的workspace

    详解Rust中的workspace

    这篇文章主要向大家介绍Rust中的workspace,主要内容包括基础应用、实用技巧、原理机制等方面,这个概念在Rust中是通用的,只不过maven换成了cargo,而模块变成了crate,下面跟着小编通过一个例子给大家介绍下
    2022-03-03
  • Rust 语言中的 into() 方法及代码实例

    Rust 语言中的 into() 方法及代码实例

    在 Rust 中,into() 方法通常用于将一个类型的值转换为另一个类型,这通常涉及到资源的所有权转移,本文给大家介绍Rust 语言中的 into() 方法及代码实例,感谢的朋友跟随小编一起看看吧
    2024-03-03
  • 一文弄懂rust声明宏

    一文弄懂rust声明宏

    Rust支持两种宏,一种是声明宏,一种是过程宏,本文主要介绍了一文弄懂rust声明宏,通过声明宏可以减少一些样板代码,具有一定的参考价值,感兴趣的可以了解一下
    2024-03-03
  • C和Java没那么香了,Serverless时代Rust即将称王?

    C和Java没那么香了,Serverless时代Rust即将称王?

    Serverless Computing,即”无服务器计算”,其实这一概念在刚刚提出的时候并没有获得太多的关注,直到2014年AWS Lambda这一里程碑式的产品出现。Serverless算是正式走进了云计算的舞台
    2021-06-06

最新评论