Rust 中的String与所有权机制

news2026/3/26 21:15:29

文章目录

一、string
二、所有权
- 2.1 所有权与作用域
- 2.2 对所有权的操作
- - 2.2.1 转移
  - 2.2.3 拷贝
  - 2.2.3 传递
- 2.3 引用
- - 2.3.1 借用
  - 2.3.2 可变引用

一、string

之前学习过 Rust 只有几种基础的数据类型，但是没有常用的字符串也就是String，今天来学习一下 String；
Rust 中 String 是标准库的一部分，也就是 std::String ，但是这个 String 与其他语言中的 String 稍有不同，比如：
在这里插入图片描述

可以看到，当我想要以一种为指定字符串类型的方式定义了一字符串变量时，编译器自动显示出的类型是 &srr 而非 String, 而我指定了 String 类型后仍然有错；而从编译器给出的提示不难看出，“hello” 这样定义得到的是一个 “&str” 类型的值而非是个字符串，那么我们先假定这是一种未知的类型，后续再处理它，先去想办法定义出我们的字符串，打开官方文档： https://doc.rust-lang.org/std/string/struct.String.html

可以看到官方文档第一个示例告诉我们要像这样创建字符串:
在这里插入图片描述

但是官方没说为什么要这样定义，幸好 Rust 的源码是可以点进去的，从 String::from 向里一步步执行：
在这里插入图片描述

from 执行的操作只有一个就是调用 to_owned 函数，但是需要注意，这里传进来的参数类型仍然是"&str"；然后 to_owned 下一步是调用 as_bytes().to_owned() ,最后这个 to_owned() 则是调用了 to_vec ；
那么至此也就明白了，对于这一行代码:

    let hello = String::from("Hello, ");

我们传入的 “Hello,” 这会被编译器认为是一个字符数组，也就是一个字符串常量，即无法对其造成改变的一个对象；但是我们需要的是一个可变的字符串而非一组固定的字符，因此编译器将这个字符数组扩展为了一个 vector , 也就变成了一个可变的字符数组，也就是我最终想要的字符串；

其实这和C++差不多，只不过C++string底层应该直接是个指针而不是个vector

这样一来 “&str” 也就理解了，就是一个常量字符数组，所以是不可变的。在官方文档搜一下，果然也有，并且还有个好听的名字，字符串切片(string slice)，具体参考： https://doc.rust-lang.org/std/primitive.str.html

官方文档中还介绍了两种类型的互转方法：
在这里插入图片描述

剩下的使用就是这两种类型自带的一些接口了，具体请参阅官方文档，这里不再细述；

二、所有权

2.1 所有权与作用域

很多小伙伴开始学习 Rust 是因为听说这是一种比C++更安全的语言，所以来了解一下，那么它安全在哪里？就安全在所有权机制，不再需要开发者像C++一样的去人工管理内存。

首先，所有程序都必须管理其运行时使用计算机内存的方式。一些语言中具有垃圾回收机制，在程序运行时有规律地寻找不再使用的内存，比如Java；另一些语言中，程序员必须亲自分配和释放内存，比如C/C++。Rust 则选择了第三种方式：通过所有权系统管理内存，编译器在编译时会根据一系列的规则进行检查。如果违反了任何这些规则，程序都不能编译。在运行时，所有权系统的任何功能都不会减慢程序。所有权有以下规则：

* Rust 中的每一个值都有一个 所有者（owner）。
* 值在任一时刻有且只有一个所有者。
* 当所有者（变量）离开作用域，这个值将被丢弃。

举个例子，有以下一段代码：

fn main() {
    let s1 = "hello";
    {                
        let s = "hello s"; 
    }  
    let s2 = "hello";
}

在上面的代码中， s 被一个括号圈住了，那么在这个括号里"hello s" 的所有者就是 s，而 s 的生命周期也只在括号范围内，也就是 s1 出现时 s 未出现， s2 出现时 s 已经死去。

有过C++ 经验的小伙伴看到这肯定很熟悉，这不就是 RAII 吗，或者说 Rust 中的每个变量都是个智能指针。

2.2 对所有权的操作

2.2.1 转移

刚刚说到这种所有权机制与C++的 RAII 很像，变量也和智能指针很像，那么是不是就和智能指针一样呢，测试一下：
在这里插入图片描述

图上可以看到，先定义了 s1 ，然后定义 s2 ，然后将 s1 传递给 s2 ，此时再使用 s1 会报错，提醒你s1 的值已经被转移出去了，这时 s1 就已经被清空了。因为 Rust 变量离开作用域时会回收，所以如果这里不清空，在程序结束时s1 s2都会被回收，那么一块内存就会回收了两次，因此 Rust 的机制中 = 操作是转移而非拷贝。

看到这里，还是觉得是智能指针，只不过是unique_ptr，QAQ

2.2.3 拷贝

= 是转移而不是拷贝，那么想要使用拷贝该怎么写呢？比如字符串这样：
在这里插入图片描述

调用 clone 函数就行了。

然后有一个很有意思的事情，比如：
在这里插入图片描述

i32 类型变量不需要使用 clone 之类的函数，= 居然就是拷贝而不是转移；
官方给出的解释是 “像整型这样的在编译时已知大小的类型被整个存储在栈上，所以拷贝其实际的值是快速的。这意味着没有理由在创建变量 y 后使 x 无效。” 恕我直言，这不就是Rust中所有用到堆的变量就用的是智能指针吗。。。。。当然也可能是我理解不够深，反正我目前为止的感受就是这样。。。。

2.2.3 传递

之前提到过 “值在任一时刻有且只有一个所有者” ，那么如果将值传递给函数会怎么样呢：
在这里插入图片描述

很明显，作为参数传递给函数之后就失去了所有权；
但这样会带来一个问题，这个值如果不只一个函数再用后续怎么办？用函数返回值返回！
但是如果参数不只有一个呢？为每个函数的返回值都定一个结构体？
这样太麻烦了，万幸的是 Rust 提供了引用。

2.3 引用

2.3.1 借用

官方说明中“引用（reference）像一个指针，因为它是一个地址，我们可以由此访问储存于该地址的属于其他变量的数据。与指针不同，引用确保指向某个特定类型的有效值。”
很好理解，改一下刚才的代码：
在这里插入图片描述

可以用了，修改就是函数声明参数时加了一个&，传参时也加了一个&；

变量 str 有效的作用域与函数参数的作用域一样，不过当 str 停止使用时并不丢弃引用指向的数据，因为 str 并没有所有权。当函数使用引用而不是实际值作为参数，无需返回值来交还所有权，因为就不曾拥有所有权。

Rust 将创建一个引用的行为称为借用（borrowing）。正如现实生活中，如果一个人拥有某样东西，你可以从他那里借来。当你使用完毕，必须还回去，并不拥有它，因此借用的值无法修改。
在这里插入图片描述

2.3.2 可变引用

正如不可变变量与可变变量一样，引用也可以变为可变引用，加个 mut 关键试试：
在这里插入图片描述

当然，像这段代码所写的，想要成为可变引用的前提是自身就是可变的。
另外，由于 Rust 的三条基础规则之“值在任一时刻有且只有一个所有者”，那么对于一个可变变量在同一个时刻也就不可以有多个引用；换个角度理解比如用一个 s1 作为 s 的可变引用后，那么 s 将不再可用，也自然不能再对一个无法使用的变量创建引用，如果这样使用编译器就会报错：
在这里插入图片描述