Rust 中的三种指针类型,你都会用么?

2,305 阅读3分钟

在 Rust 中有三种基本的指针类型:引用、Box、unsafe 指针。

引用

引用(Borrowing)是 Rust 的核心概念之一,它允许你通过引用访问数据而不取得所有权。这意味着数据的所有权仍在原来的变量,引用只是临时借用。当引用离开它的生命周期后,所有权不会转移。引用主要用于函数参数传递和临时访问数据等场景。

let x = 10;
let y = &x;
println!("{}", y); // prints: 10

在这个例子中,假设 x 存储在内存地址 0x100(仅为示例,实际地址可能有所不同),则变量 y 存储的实际数据是地址 0x100

内存地址             值
-----------------------------------
0x100             10 (value of x)
...
0x200             0x100 (value of y, i.e., memory location of x)
-----------------------------------

从上面的内存布局中,我们可以看到 y 存储在内存的另一个地方,但其值实际上是 x 所在的内存地址。

Rust 的指针有以下两种类型:

&t

一个不可变的共享引用。你可以同时拥有同一个值的多个共享的引用,但它们都是只读的:修改它们指向的值是禁止的。

&mut T

一个可变的、独占的引用。你可以读写它指向的值,只要这个引用存在,你不能再持有任何这个值的其他任何类型的引用。

Rust 使用这种方式来区分共享和可变引用。以此来强调执行“单个写者或多个读者”规则:要么你可以读写值,要么它只能被任何数量的读者共享。这种分隔由编译器检查来强制执行,它是Rust安全保证的核心。

Box

Box 是 Rust 提供的一个智能指针类型,其主要目的是在堆上分配数据。当你把数据放入 Box 时,它将成为该数据的所有者,这意味着 Box 的生命周期结束时,它将负责清理内存。Box 通常用于在堆上创建大数据、所有权转移以及创建递归类型等场景。

let x = Box::new(10);
println!("{}", x); // prints: 10

下图展示了 Box<i32> 的内存布局。这里有一个 Box 指针,它存储在栈上,同时指向堆上存储的 i32 变量。

栈(Stack)                                     堆 (Heap)
+------+                         +-----------------------+ 
| Box  | ------> Points To ------>|        i32           |
+------+                         +-----------------------+

你可以把 Box 指针理解成一个保存了数据地址的普通变量,当程序需要获取 Box 中的数据时,它首先会找到 Box 指针,然后通过该指针找到真正的数据。

Box 的生命周期结束时(例如,它离开了它的作用域),Rust 将自动清理 Box 以及其对应的堆内存,这是通过调用 Drop trait 来实现的。这就是为什么 Box 被称为“smart pointer”(智能指针):它知道如何清理自己所拥有的资源。

引用和 Box 的区别

  • 引用是借用数据的所有权,不负责数据的清理。
  • Box 是获取数据的所有权,并在生命周期结束时负责清理数据。

原始指针

Rust 也有原始指针类型 *mut T*const T。使用原始指针是不安全的,因为 Rust 无法追踪它指向的到底是什么。例如,原始指针可能是空、或者可能指向被释放的内存、或者现在指向一个和之前不同类型的值。

然而,你只能在 unsafe 块中解引用原始指针。unsafe 块是 Rust 中的可选机制,它的安全性取决于你自己。如果你的代码没有 unsafe 块(或者有 unsafe 块但里面的代码都是完全正确的),那么整本书中强调的安全性保证都适用。