Rust 學習筆記：枚舉與模式匹配

Rust 學習筆記：枚舉與模式匹配
- 定義枚舉（Enum）
- 枚舉變量
- Option 枚舉及其相對于 NULL 的優勢
- match 和枚舉
- 與 Option\<T\> 匹配
- match 應該是詳盡的
- Catch-all 模式和 _ 占位符
- 使用 if let 和 let else 簡化控制流
- let else 的高階用法

Rust 學習筆記：枚舉與模式匹配

在本文中，首先，我們將定義和使用枚舉。接下來，我們將探討一個特別有用的枚舉，稱為 Option。然后，我們將了解 match 表達式中的模式匹配。最后，我們將介紹 if let 構造。

定義枚舉（Enum）

結構體提供了一種將相關字段和數據分組在一起的方法，而枚舉則提供了一種說明一個值是一組可能值中的一個的方法。

任何 IP 地址都可以是 IPv4 或者 IPv6，但不能同時是這兩個地址。IP 地址的這個屬性使得枚舉數據結構非常合適，因為枚舉值只能是它的一個變體。

定義 IpAddrKind 枚舉：

enum IpAddrKind {V4,V6,
}

IpAddrKind 是一個自定義數據類型。

枚舉變量

我們可以像這樣創建 IpAddrKind 的兩個變體的實例：

    let four = IpAddrKind::V4;let six = IpAddrKind::V6;

注意，枚舉的變體位于其標識符下的命名空間中，我們使用雙冒號分隔兩者。這是有用的，因為現在兩個值 IpAddrKind::V4 和 IpAddrKind::V6 都是同一類型：IpAddrKind。

我們還可以定義一個接受任意 IpAddrKind 的函數：

fn route(ip_kind: IpAddrKind) {}

我們可以用任意一個變量調用這個函數：

    route(IpAddrKind::V4);route(IpAddrKind::V6);

枚舉可以作為結構體的字段：

    enum IpAddrKind {V4,V6,}struct IpAddr {kind: IpAddrKind,address: String,}let home = IpAddr {kind: IpAddrKind::V4,address: String::from("127.0.0.1"),};let loopback = IpAddr {kind: IpAddrKind::V6,address: String::from("::1"),};

但是，僅使用枚舉表示相同的概念更為簡潔：我們可以將數據直接放入每個枚舉變體中，而不是在結構體中使用枚舉。這個枚舉的新定義表明，V4 和 V6 的實例將具有相關的 String 值：

    enum IpAddr {V4(String),V6(String),}let home = IpAddr::V4(String::from("127.0.0.1"));let loopback = IpAddr::V6(String::from("::1"));

我們直接將數據附加到枚舉的每個變體上，因此不需要額外的結構體。我們定義的每個枚舉變體的名稱也成為構造枚舉實例的函數。也就是說，IpAddr::V4() 是一個函數調用，它接受一個 String 參數并返回一個 IpAddr 類型的實例。

使用 enum 而不是 struct 還有另一個好處：每個變量可以有不同的關聯數據類型和數量。如果我們想要將 V4 地址存儲為四個 u8 值，但仍然將 V6 地址表示為一個 String 值，那么我們將無法使用結構體。枚舉可以輕松處理這種情況：

    enum IpAddr {V4(u8, u8, u8, u8),V6(String),}let home = IpAddr::V4(127, 0, 0, 1);let loopback = IpAddr::V6(String::from("::1"));

讓我們來看看標準庫是如何定義 IpAddr 的：兩個不同結構體的形式將地址數據嵌入到變量中，每個變量的定義不同。

struct Ipv4Addr {// --snip--
}struct Ipv6Addr {// --snip--
}enum IpAddr {V4(Ipv4Addr),V6(Ipv6Addr),
}

注意，即使標準庫包含了 IpAddr 的定義，我們仍然可以創建和使用我們自己的定義而不會產生沖突，因為我們沒有將標準庫的定義引入我們的作用域。

我們也可以使用 impl 在枚舉上定義方法：

    impl Message {fn call(&self) {// method body would be defined here}}let m = Message::Write(String::from("hello"));m.call();

方法的主體會使用 self 來獲取我們調用該方法的值。在這個例子中，我們創建了一個變量 m，它的值是 Message::Write(String::from(“hello”))，這就是 m.call() 運行時調用方法體中的 self 的值。

Option 枚舉及其相對于 NULL 的優勢

Option 是標準庫定義的另一個枚舉。Option 類型編碼了一種非常常見的場景，在這種場景中，值可以是什么東西，也可以是空（什么都沒有）。

Rust沒有許多其他語言所具有的 null 特性。null 是一個表示沒有值的值。在帶有 null 的語言中，變量總是處于兩種狀態之一：null 或非 null。

空值的問題是，如果嘗試將空值用作非空值，將得到某種錯誤。然而，null 試圖表達的概念仍然是有用的：null 是由于某種原因當前無效或不存在的值。

問題不在于概念，而在于具體的實現。因此，Rust 沒有空值，但它有一個枚舉，可以編碼值存在或不存在的概念。該 enum 為 Option<T>，由標準庫定義如下：

enum Option<T> {None,Some(T),
}

可以直接使用 Some 和 None，而不使用 Option:: 前綴。Some(T) 和 None 是 Option<T> 類型的變體。

<T> 語法是 Rust 的一個我們還沒有討論的特性。它是一個泛型類型參數，意味著 Option 枚舉的某些變體可以保存任何類型的數據。

示例：

    let some_number = Some(5);let some_char = Some('e');let absent_number: Option<i32> = None;

some_number 的類型為 Option<i32>，some_char 的類型是 Option<char>。對于 None，Rust 要求必須提供具體的 Option 類型。

當我們有一個 None 值時，在某種意義上它和 null 的意思是一樣的：我們沒有一個有效值。那么為什么 Option<T> 比 null 好呢？因為 Option<T> 和 T （T 可以是任何類型）是不同的類型。

例如，這段代碼無法編譯，因為它試圖將 i8 添加到 Option<i8>：

    let x: i8 = 5;let y: Option<i8> = Some(5);let sum = x + y;

Rust 不理解如何添加 i8 和 Option<i8>，因為它們是不同的類型。

須先將 Option<T> 轉換為 T，然后才能對其執行 T 操作。一般來說，這有助于抓住 null 最常見的問題之一：假設某些東西不是空的，而實際上是空的。為了擁有一個可能為空的值，必須顯式地將該值的類型設置為 Option<T>。然后，當使用該值時，需要顯式地處理該值為空的情況。只要值的類型不是 Option<T>，就可以放心地假設該值不為空。

這是 Rust 經過深思熟慮的設計決策，目的是限制 null 的普遍性，提高 Rust 代碼的安全性。

match 和枚舉

match 表達式是一個控制流結構，當與枚舉一起使用時，它就是這樣做的：它將運行不同的代碼，這取決于它擁有的枚舉的哪個變體，并且該代碼可以使用匹配值中的數據。

我們可以編寫一個函數，它接受一枚未知的美國硬幣，并以與計數機類似的方式確定它是哪一枚硬幣，并返回其以美分為單位的值：

enum Coin {Penny,Nickel,Dime,Quarter,
}fn value_in_cents(coin: Coin) -> u8 {match coin {Coin::Penny => {println!("Lucky penny!");1}Coin::Nickel => 5,Coin::Dime => 10,Coin::Quarter => 25,}
}

當匹配表達式執行時，它按順序將結果值與每個模式進行比較。如果模式匹配該值，則執行與該模式關聯的代碼。如果該模式與值不匹配，則繼續執行。

match 的的另一個有用特性是：它們可以綁定到與模式匹配的值部分。這就是從枚舉變量中提取值的方法。

作為一個例子，讓我們修改一個枚舉變量，使其包含數據。

#[derive(Debug)] // so we can inspect the state in a minute
enum UsState {Alabama,Alaska,// --snip--
}enum Coin {Penny,Nickel,Dime,Quarter(UsState),
}

在這段代碼的匹配表達式中，我們將一個名為 state 的變量添加到匹配變量 Coin::Quarter 值的模式中。當一個 Coin::Quarter 匹配時，狀態變量將綁定到該 Quarter 的狀態值。然后我們可以在代碼中使用 state，如下所示：

fn value_in_cents(coin: Coin) -> u8 {match coin {Coin::Penny => 1,Coin::Nickel => 5,Coin::Dime => 10,Coin::Quarter(state) => {println!("State quarter from {state:?}!");25}}
}

如果我們調用 value_in_cents(Coin::Quarter(UsState::Alaska))，Coin 將是 Coin::Quarter(UsState::Alaska)。當我們將該值與每個匹配進行比較時，在到達 Coin::Quarter(state) 之前，它們都不匹配。此時，州的綁定將是值 UsState::Alaska。然后我們可以使用 println! 打印該值。

與 Option<T> 匹配

我們還可以使用 match 來處理 Option<T>。

編寫一個函數，它接受 Option<i32>，如果里面有一個值，則將該值加 1。如果里面沒有值，函數應該返回 None 值，并且不嘗試執行任何操作。

    fn plus_one(x: Option<i32>) -> Option<i32> {match x {None => None,Some(i) => Some(i + 1),}}let five = Some(5);let six = plus_one(five);let none = plus_one(None);

match 應該是詳盡的

match 中的模式必須涵蓋所有可能性。

考慮一下這個版本的 plus_one 函數：

    fn plus_one(x: Option<i32>) -> Option<i32> {match x {Some(i) => Some(i + 1),}}

報錯：error[E0004]: non-exhaustive patterns: `None` not covered。

我們沒有處理 None 的情況，所以無法編譯。

Rust 中的匹配是詳盡的：為了使代碼有效，我們必須窮盡每一種可能性。特別是在 Option<T> 的情況下，當 Rust 防止我們忘記顯式處理 None 情況時，它保護我們避免在可能為 null 的情況下假設我們有一個值。

Catch-all 模式和 _ 占位符

使用枚舉，我們還可以對一些特定的值采取特殊的操作，但對所有其他值采取默認操作。

    let dice_roll = 9;match dice_roll {3 => add_fancy_hat(),7 => remove_fancy_hat(),other => move_player(other),}fn add_fancy_hat() {}fn remove_fancy_hat() {}fn move_player(num_spaces: u8) {}

最后一個模式 other 將匹配所有沒有明確列出的值，other 必須放在最后。

當我們想要捕獲所有值，但又不想在捕獲所有值的模式中使用值時可以使用 _。這是一個特殊的模式，它匹配任何值，并且不綁定到該值。這告訴 Rust 我們不打算使用這個值，所以 Rust 不會警告我們一個未使用的變量。

    let dice_roll = 9;match dice_roll {3 => add_fancy_hat(),7 => remove_fancy_hat(),_ => reroll(),}fn add_fancy_hat() {}fn remove_fancy_hat() {}fn reroll() {}

這個例子也滿足窮竭性要求，因為我們顯式地忽略了所有的其他值。

還可以有另外一種寫法：

    let dice_roll = 9;match dice_roll {3 => add_fancy_hat(),7 => remove_fancy_hat(),_ => (),}fn add_fancy_hat() {}fn remove_fancy_hat() {}

使用 () 作為與 _ 匹配時的動作。這將告訴 Rust：不使用任何不匹配先前模式的值，并且不想在這種情況下運行任何代碼。

使用 if let 和 let else 簡化控制流

if let 語法以一種更簡潔的方式來處理匹配一個模式的值，同時忽略其他模式。

    let config_max = Some(3u8);match config_max {Some(max) => println!("The maximum is configured to be {max}"),_ => (),}

如果值是 Some，我們通過將值綁定到模式中的變量 max 來打印出 Some 變量中的值。不對 None 值做任何事情。

每次都要寫 _ => () 確實很煩，可以用 if let 語法進行簡化：

    let config_max = Some(3u8);if let Some(max) = config_max {println!("The maximum is configured to be {max}");}

if let 的語法接受一個模式和一個用等號分隔的表達式。它的工作方式與匹配相同，將表達式提供給匹配，而模式是它的第一個臂。在本例中，模式是 Some(max)，并且 max 綁定到 Some 內部的值。if let 塊中的代碼僅在值與模式匹配時運行。

使用 if let 意味著更少的輸入、更少的縮進和更少的樣板代碼。但是，失去了 match 強制執行的詳盡檢查。

換句話說，可以將 if let 視為匹配的語法糖，當值匹配一個模式時運行代碼，然后忽略所有其他值。

我們可以在 if 語句中包含 else 語句，該代碼塊相當于 if let 和 else。

match 寫法：

    let mut count = 0;match coin {Coin::Quarter(state) => println!("State quarter from {state:?}!"),_ => count += 1,}

if let…else 寫法：

    let mut count = 0;if let Coin::Quarter(state) = coin {println!("State quarter from {state:?}!");} else {count += 1;}

let else 的高階用法

let else 語法在左側接受一個模式，在右側接受一個表達式（變量），這與 if let 非常相似，但它沒有 if 分支，只有 else 分支。如果模式匹配，它將在外部作用域中綁定來自模式的值。如果模式不匹配，程序將進入 else。

一種常見的模式是當值存在時執行一些計算，否則返回默認值。

fn describe_state_quarter(coin: Coin) -> Option<String> {if let Coin::Quarter(state) = coin {if state.existed_in(1900) {Some(format!("{state:?} is pretty old, for America!"))} else {Some(format!("{state:?} is relatively new."))}} else {None}
}

我們還可以利用表達式生成的值來從 if let 中生成狀態或提前返回。

用 if let 來寫：

fn describe_state_quarter(coin: Coin) -> Option<String> {let state = if let Coin::Quarter(state) = coin {state} else {return None;};if state.existed_in(1900) {Some(format!("{state:?} is pretty old, for America!"))} else {Some(format!("{state:?} is relatively new."))}
}

用 let else 來寫，會更簡單：

fn describe_state_quarter(coin: Coin) -> Option<String> {let Coin::Quarter(state) = coin else {return None;};if state.existed_in(1900) {Some(format!("{state:?} is pretty old, for America!"))} else {Some(format!("{state:?} is relatively new."))}
}