Rust学习第四天
Rust学习第四天
1、Rust循环
while 循环
while 循环是最典型的条件语句循环:
1 | fn main() { |
运行结果:
1 | 1 |
在 C 语言中 for 循环使用三元语句控制循环,但是 Rust 中没有这种用法,需要用 while 循环来代替:
C语言:
1 | int i; |
Rust:
1 | let mut i = 0; |
for 循环
for 循环是最常用的循环结构,常用来遍历一个线性数据结构(比如数组)。for 循环遍历数组:
1 | fn main() { |
运行结果为:
1 | i的值为1 |
这个程序中的 for 循环完成了对数组 a 的遍历。a.iter() 代表 a 的迭代器(iterator),先不做深入理解
for 循环可以通过下标来访问数组的:
1 | fn main() { |
运行结果:
1 | a[0] = 1 |
改为数组长度为循环限制
1 | fn main() { |
loop 循环
开发过程中,如果某个循环无法在开头和结尾判断是否继续进行循环,必须在循环体中间某处控制循环的进行。如果遇到这种情况,我们经常会在一个 while (true) 循环体里实现中途退出循环的操作。
Rust 语言有原生的无限循环结构 —— loop:
1 | fn main() { |
运行结果:
1 | t |
oop 循环可以通过 break 关键字类似于 return 一样使整个循环退出并给予外部一个返回值。这是一个十分巧妙的设计,因为 loop 这样的循环常被用来当作查找工具使用,如果找到了某个东西当然要将这个结果交出去:
1 | fn main() { |
运行结果为:
1 | 's'的索引为2 |
2、Rust所有权
什么是所有权
计算机程序必须在运行时管理它们所使用的内存资源。
大多数的编程语言都有管理内存的功能:
C/C++ 这样的语言主要通过手动方式管理内存,开发者需要手动的申请和释放内存资源。但为了提高开发效率,只要不影响程序功能的实现,许多开发者没有及时释放内存的习惯。所以手动管理内存的方式常常造成资源浪费。
Java 语言编写的程序在虚拟机(JVM)中运行,JVM 具备自动回收内存资源的功能。但这种方式常常会降低运行时效率,所以 JVM 会尽可能少的回收资源,这样也会使程序占用较大的内存资源。
所有权对大多数开发者而言是一个新颖的概念,它是 Rust 语言为高效使用内存而设计的语法机制。所有权概念是为了让 Rust 在编译阶段更有效地分析内存资源的有用性以实现内存管理而诞生的概念。
所有权规则
所有权有以下三条规则:
- Rust 中的每个值都有一个变量,称为其所有者。
- 一次只能有一个所有者。
- 当所有者不在程序运行范围时,该值将被删除。
这三条规则是所有权概念的基础。
变量范围
我们用下面这段程序描述变量范围的概念:
1 | { |
变量范围是变量的一个属性,其代表变量的可行域,默认从声明变量开始有效直到变量所在域结束。
内存和分配
如果我们定义了一个变量并给它赋予一个值,这个变量的值存在于内存中,这种情况很普遍。
但如果我们需要储存的数据长度不确定(比如用户输入的一串字符串),我们就无法在定义时明确数据长度,也就无法在编译阶段令程序分配固定长度的内存空间供数据储存使用(有人说分配尽可能大的空间可以解决问题,但这个方法很不文明)。
这就需要提供一种在程序运行时程序自己申请使用内存的机制——堆。本章所讲的所有”内存资源”都指的是堆所占用的内存空间。
有分配就有释放,程序不能一直占用某个内存资源。因此决定资源是否浪费的关键因素就是资源有没有及时的释放。
C语言中的资源释放为free:
1 | { |
很显然,Rust 中没有调用 free 函数来释放字符串 s 的资源(我知道这样在 C 语言中是不正确的写法,因为 “abcd” 不在堆中,这里假设它在)。Rust 之所以没有明示释放的步骤是因为在变量范围结束的时候,Rust 编译器自动添加了调用释放资源函数的步骤。
这种机制看似很简单了:它不过是帮助程序员在适当的地方添加了一个释放资源的函数调用而已。但这种简单的机制可以有效地解决一个史上最令程序员头疼的编程问题。
变量与数据交互的方式
变量与数据交互方式主要有移动(Move)和克隆(Clone)两种:
移动(Move):
多个变量可以在 Rust 中以不同的方式与相同的数据交互:
1 | let x = 5; |
这个程序将值 5 绑定到变量 x,然后将 x 的值复制并赋值给变量 y。现在栈中将有两个值 5。此情况中的数据是”基本数据”类型的数据,不需要存储到堆中,仅在栈中的数据的”移动”方式是直接复制,这不会花费更长的时间或更多的存储空间。
但如果发生交互的数据在堆中就是另外一种情况:
1 | let s1 = String::from("hello"); |
第一步产生一个 String 对象,值为 “hello”。其中 “hello” 可以认为是类似于长度不确定的数据,需要在堆中存储
第二步的情况略有不同(这不是完全真的,仅用来对比参考):
如图所示:两个 String 对象在栈中,每个 String 对象都有一个指针指向堆中的 “hello” 字符串。在给 s2 赋值时,只有栈中的数据被复制了,堆中的字符串依然还是原来的字符串。
前面我们说过,当变量超出范围时,Rust 自动调用释放资源函数并清理该变量的堆内存。但是 s1 和 s2 都被释放的话堆区中的 “hello” 被释放两次,这是不被系统允许的。为了确保安全,在给 s2 赋值时 s1 已经无效了。
没错,在把 s1 的值赋给 s2 以后 s1 将不可以再被使用。
例如:
1 | fn main() { |
s1 名存实亡。
克隆(Clone)
Rust会尽可能地降低程序的运行成本,所以默认情况下,长度较大的数据存放在堆中,且采用移动的方式进行数据交互。但如果需要将数据单纯的复制一份以供他用,可以使用数据的第二种交互方式——克隆。
1 | fn main() { |
运行结果:
1 | hello, world! |
这里是真的将堆中的 “hello” 复制了一份,所以 s1 和 s2 都分别绑定了一个值,释放的时候也会被当作两个资源。
当然,克隆仅在需要复制的情况下使用,毕竟复制数据会花费更多的时间。
涉及函数的所有权机制
对于变量来说这是最复杂的情况了。
如果将一个变量当作函数的参数传给其他函数,怎样安全的处理所有权呢?
下面这段程序描述了这种情况下所有权机制的运行原理:
1 | fn main() { |
如果将变量当作参数传入函数,那么它和移动的效果是一样的。
函数返回值的所有权机制
实例
1 | fn main() { |
被当作函数返回值的变量所有权将会被移动出函数并返回到调用函数的地方,而不会直接被无效释放。
引用与借用
引用(Reference)是 C++ 开发者较为熟悉的概念。
如果你熟悉指针的概念,你可以把它看作一种指针。
实质上”引用”是变量的间接访问方式。
1 | fn main() { |
运算结果:
1 | s1 is hello, s2 is hello |
& 运算符可以取变量的”引用”。
当一个变量的值被引用时,变量本身不会被认定无效。因为”引用”并没有在栈中复制变量的值:
函数参数传递的道理一样:
1 | fn main() { |
运行结果:
1 | The length of 'hello' is 5. |
引用不会获得值的所有权。
引用只能租借(Borrow)值的所有权。
引用本身也是一个类型并具有一个值,这个值记录的是别的值所在的位置,但引用不具有所指值的所有权:
例如:
1 | fn main() { |
这段程序不正确:因为 s2 租借的 s1 已经将所有权移动到 s3,所以 s2 将无法继续租借使用 s1 的所有权。如果需要使用 s2 使用该值,必须重新租借:
1 | fn main() { |
这段程序是正确的。
引用不具有所有权,即使它租借了所有权,它也只享有使用权。
如果尝试利用租借来的权利来修改数据会被阻止:
1 | fn main() { |
这段程序中 s2 尝试修改 s1 的值被阻止,租借的所有权不能修改所有者的值。
当然,也存在一种可变的租借方式:
1 | fn main() { |
这段程序就没有问题了。我们用 &mut 修饰可变的引用类型。
这里有趣的是s2不需要添加mut,即使我们是对s2进行字符串拼接,我的思考认为应该是,实际上还是对s1进行操作,只不过在操作的时候需要声明拥有对s1进行改变的所有权操作权限,当然前提是s1需要自身可变。
可变引用与不可变引用相比除了权限不同以外,可变引用不允许多重引用,但不可变引用可以:
1 | let mut s = String::from("hello"); |
这段程序不正确,因为多重可变引用了 s。
Rust 对可变引用的这种设计主要出于对并发状态下发生数据访问碰撞的考虑,在编译阶段就避免了这种事情的发生。
由于发生数据访问碰撞的必要条件之一是数据被至少一个使用者写且同时被至少一个其他使用者读或写,所以在一个值被可变引用时不允许再次被任何引用。
垂悬引用(Dangling References)
这是一个换了个名字的概念,如果放在有指针概念的编程语言里它就指的是那种没有实际指向一个真正能访问的数据的指针(注意,不一定是空指针,还有可能是已经释放的资源)。它们就像失去悬挂物体的绳子,所以叫”垂悬引用”。
“垂悬引用”在 Rust 语言里不允许出现,如果有,编译器会发现它。
下面是一个垂悬的典型案例:
1 | fn main() { |
很显然,伴随着 dangle 函数的结束,其局部变量的值本身没有被当作返回值,被释放了。但它的引用却被返回,这个引用所指向的值已经不能确定的存在,故不允许其出现。
本文参考文章链接: