Rust的自引用（1）：不安全的移动Rust中，自引用结构体是一种特殊的结构体。如果你想了解Rust异步机制的设计与实现

Rust中的自引用结构体，是这么一种结构体：它内部有某个引用，指向自身的一部分。

这种结构体在某些场景下很有用。Rust编译器实现的Future就是自引用结构体。它是一个状态机，所有的sync代码块或函数都会被编译器转化成这种结构。

Future可能被随时调度和执行，因此需要保存它当前的运行状态，以能下次继续执行。保存的状态，包括了它内部变量之间的关系。

async {
    let mut s = String::from("foo");
    let s_ref = &s;
    println!("{:?}", s_ref);
}

比如这段异步代码，当Future执行到let s_ref = &s后停下来，你可以认为，它内部要存两个值：s和s_ref，且s_ref要指向s。这就是一个自引用的关系。

如果你想了解Rust异步机制的设计与实现，那就必须先知道自引用结构体的特点。

在这篇文章里，我将介绍自引用结构体在Rust中存在问题。我们先来思考：应该如何实现一个自引用结构体？

目标

struct SelfRef {
	a: Data,
	b: Ptr,  // 我们希望b指向a
}

先确定设计目标：实现安全的自引用结构体——如果以safe方式操作这个结构体，那永远不会出现未定义行为（Undefined Behavior，UB）。

有人可能会疑惑，Rust本身不就保证安全性了吗，那为什么还要注意UB？因为自引用结构体定义和使用没那么简单。在下面的讨论里，会需要unsafe代码，因此自然要小心地保证它是安全的。

自引用结构体的定义——引用b永远都指向自身的字段a——是一种使用的契约。我们需要保证该结构体变量，永远都有这个性质，这样才不会发生危险的行为。

如果结构体总是「自引用」的，那它的方法必定都是按照这个特点实现的。想象一下，如果在safe代码下，用户能以某种方式让引用b指向其它数据，那这些方法的安全前提就被破坏了。执行它们可能出现无法预期的行为。比如，用户让引用b变成空指针，或者指向类型完全不同的值，那访问就会出现问题。

当然，可以要求用户在使用前，通过检查指针来保证安全。但这是通过行为来保证安全，而不是通过设计来保证。否则，就退回到C++编程上了。

接下来，开始尝试吧。

第一次尝试：`&T`

先考虑完全用safe代码来实现它。定义结构体：

struct SelfRef<'a> {
	a: String,
	b: &'a str,  // 我们希望b指向a
}

接着先用笨方法来初始化它：

let s = String::from("");
let mut v = SelfRef {
    a: String::from("hello"),
    b: &s,
};
v.b = &v.a;

由于b不能是空指针，于是先给它一个占位符，等结构体初始化完成后再重新赋值。看着有点丑，但好歹我们完成了，现在v.b指向的是v.a。

这个过程肯定不能暴露给用户，否则无法保证它永远是自引用的。于是做个封装：

impl<'a> SelfRef<'a> {
    fn new(data: &str) -> Self {
        let s = String::from("");
        let mut v = Self {
            a: String::from(data),
            b: &s,
        };
        v.b = &v.a;
        v
    }
}

毫无疑问，编译器报错了：

cannot move out of `v` because it is borrowed
   returning this value requires that `v.a` is borrowed for `'a`

我们在new方法里创建了v，且v.b指向的是当前v的某个内存区域。但当new方法返回时，v中的数据移动到了其他的内存位置，原本v.b指向的内存就失效了。这违反了Rust的借用规则。

这个问题似乎没法解决，我们无法用&T实现自引用结构体。

第二次尝试：`*const T`

初始化

编译器报错的原因，在于结构体的生命周期标注。那如果引入unsafe代码，用裸指针代替引用，去掉生命周期标注，是否可行？再试试看：

struct SelfRef {
    a: String,
    b: *const String,  // 裸指针
}

实现初始化方法：

impl SelfRef {
    fn new(data: &str) -> Self {
        Self {
            a: String::from(data),
            b: std::ptr::null(),  // 先初始化为空指针
        }
    }

    fn init(&mut self) {
        let self_ptr: *const String = &self.a;
        self.b = self_ptr;  // 指向自身
    }
}

用户可以用下面的代码初始化：

let mut v = SelfRef::new("hello");
v.init();

new方法返回时，发生了移动，所以无法获得a的地址。因此我们分成了两个方法来初始化。现在，当裸指针b非空时，那就可以确定它是指向自身的。

唯一的缺陷是，用户可能忘记调用init来初始化，使得b是空指针。但在代码里可以做对应的检查，比如：

impl SelfRef {
    fn do_something(&mut self) {
        if self.b.is_null() {
            self.init();
        }
        // do something
    }
}

看来初始化的问题解决了。

添加方法

接着尝试给它增加一些方法：

impl SelfRef {
    fn set_a(&mut self, data: &str) {
        self.a = String::from(data);
    }

    fn b(&mut self) -> &String {
        assert!(!self.b.is_null(), "called without init");
        unsafe { &*(self.b) }
    }
}

使用

let mut v = SelfRef::new("hello");
v.init();
println!("{:?}", v.b()); // hello
v.set_a("world");
println!("{:?}", v.b()); // world

很不错！即使是修改了v.b的值，v.a依然指向它。看起来，只要不暴露任何能修改指针的方式，那它永远是自引用的，是合法的。

不安全的移动

似乎问题解决了，我们用裸指针实现了一个安全的自引用结构体。

但真的安全吗？很不幸，虽然我们小心谨慎，但它依然会在移动时出现问题。

问题

看这段代码：

let mut vv = v;
vv.set_a("foo");
println!("{:?}", vv.b());

预期是打印foo。但我执行了两次，结果都不一样（你的可能不同）：

// 第一次打印了乱码
"@@u\u{10}*"

// 第二次运行，直接崩溃
thread 'main' panicked at library/core/src/fmt/mod.rs:2463:26:
byte index 4 is not a char boundary; it is inside 'Ҍ' (bytes 3..5) of `@�Ҍ`
stack backtrace:
   0:        0x102921618 - std::backtrace_rs::backtrace::libunwind::trace::h8e34a2e8e90ca39c ...

我们移动了自引用结构体，接着就访问到了非法内存。在safe代码中发生了这种事，是我们无法容忍的。解决它之前，先要理解这背后发生了什么。

移动是什么

let a = b;

这是一个值移动的操作。可以理解成它背后发生了这样的事：

先为a变量开辟一个新内存
将b的数据复制到a所指向的内存中
清空b所指向的内存中原本的数据

这里的a和b都是在栈上，虽然涉及数据的复制，但非常快。而且Rust编译器会做优化（比如不一定清空b内存的数据），因此开销很小。

变量代表了某个内存地址，是固定的。而所有权针对的是值。如果a变量拥有值x的所有权，那就能理解为，a的地址存放了x的数据（或指向它的指针）。如果值x移动了，那可以说它的数据从某个内存区域转移到了另一个地方，所有权移动到了其他变量身上。

以下代码：

#[derive(Debug)]
struct Foo(i32);
let mut a = Foo(42);
println!("&a = {:?}", &a as *const _);
let b = Foo(30);
println!("&b = {:?}", &b as *const _);
a = b;
println!("&a = {:?}", &a as *const _);

我的打印结果（你的可能不同）

&a = 0x16b6357d0
&b = 0x16b635850
&a = 0x16b6357d0

两次打印的a地址都相同，变的是它内部存放的值。

这样，就能理解为什么移动自引用数据会出现问题：执行let mut vv = v后，v就释放了自身的内存。但vv.b的指向还是原来的v.a。此时访问vv.b就是非法的。

转存失败，建议直接上传图片文件

无处不在的移动

移动是Rust里的基本操作。从定义来说，它只是「将整块数据一同搬到某个内存」的行为。它不仅发生在操作T上，也能发生在操作&mut T时。后者的使用也很普遍，比如这几个方法：

std::mem::swap(&mut T, &mut T)：交换两个变量的值。
std::mem::take(&mut T)：返回变量的值，并将其置为默认值。
std::mem::replace(&mut T, T)：返回变量的值，并将其置为指定值。
Option::take(&mut self)：取出Option的包装值，并将self置为None。

这些方法，都是对&mut T所指向的值做替换，并把原来的值「移动」到了其他的内存区域。

这些方法不受限于任何特征或类型的实现，只需要&mut T。这样就很危险了——只要我们得到自引用结构体的&mut T，就能移动它的值，然后引发安全问题，比如让内部的引用指向非法的内存。

这非常危险，而且看起来没有解决的方式。

总结

我们尝试了两种方案实现自引用结构体：

&T：普通的引用。无法限制结构体维持自引用的特点。
*const T：裸指针。谨慎地暴露方法，可以让结构体保持自引用。但在数据移动时，可能出现非法的内存访问。

这两种方案都失败了。

自引用结构体的实现，并不是容易的事。在大名鼎鼎的Too Many Linked List中，第一次对双向队列的实现，就遇到了自引用问题。最后的方案是修改数据结构，使其不再是自引用，用这种方式绕过去（不过人家也是为了教学）。

那没有什么方案能实现自引用结构吗？当然有：

使用Rc和RefCell：不用引用，而是直接拥有所有权（严格来说，这就不是自引用结构体了）。但这种方式不仅增加代码理解的负担，维持Rc的引用计数也需要额外的开销。
使用Pin：既然自引用结构体在移动才会出现不安全问题，那限制它的移动就好了。这就是Pin的思路。

我们将在下节介绍Pin如何实现自引用结构体。

关于作者：Rust开发者，从事密码学相关的开发，喜欢研究底层相关的问题。GitHub主页。个人博客。

Rust的自引用（1）：不安全的移动

目标

第一次尝试：&T

第二次尝试：*const T

初始化