這些方法在.NET7 中變得更快

照片來自 CHUTTERSNAP^[1] 的 Unsplash^[2]

歡迎閱讀.NET 性能系列的第一章。這一系列的特點是對.NET 世界中許多不同的主題進行研究、比較性能。正如標題所說的那樣，本章節在于.NET7 中的性能改進。你將看到哪種方法是實現特定功能最快的方法，以及大量的技巧和敲門，如何付出較小的代價就能最大化你代碼性能。如果你對這些主題感興趣，那請您繼續關注。

.NET 7 目前（17.10.2022）處于預覽階段，將于 2022 年 11 月發布。通過這個新版本，微軟提供了一些大的性能改進。這篇 .NET 性能系列的第一篇文章，是關于從.NET6 到.NET7 最值得注意的性能改進。

LINQ

最相關的改進肯定是在 LINQ 中，在.NET 7 中dotnet 社區^[3]利用 LINQ 中對數字數組的處理來使用Vector<T>(SIMD)。這大大改善了一些 LINQ 方法性能，你可以在List<int>或int[]以及其他數字集合上調用。現在 LINQ 方法也能直接訪問底層數組，而不是使用枚舉器訪問。讓我們來看看這些方法相對于.NET 6 是如何表現的。

我使用BenchmarkDotNet^[4]來比較.NET6 和.NET7 相同代碼的性能。

1. Min 和 Max 方法

首先是 LINQ 方法Min()和Max()。它們被用來識別數字枚舉中的最低值或最高值。新的實現特別要求有一個先前枚舉的集合作為源，因此我們必須在這個基準測試中創建一個數組。

[Params(1000)]
public?int?Length?{?get;?set;?}private?int[]?arr;[GlobalSetup]
public?void?GlobalSetup()?=>?arr?=?Enumerable.Range(0,?Length).ToArray();[Benchmark]
public?int?Min()?=>?arr.Min();[Benchmark]
public?int?Max()?=>?arr.Max();

在.NET 6 和.NET 7 上執行這些基準，在我的機器上會得出以下結果。

方法	數組長度	平均值	比率	分配
Min	1000	3,494.08 ns	53.24	32 B
Min	1000	65.64 ns	1.00	-

Max	1000	3,025.41 ns	45.92	32 B
Max	1000	65.93 ns	1.00	-

這里非常突出的是新的.NET7 所展示的性能改進有多大。我們可以看到與.NET 6 相比，改進幅度超過 4500%。這不僅是因為在內部實現中使用了另一種類型，而且還因為不再發生額外的堆內存分配。

2. Average 和 Sum

另一個很大的改進是Average()和Sum()方法。當處理大的double集合時，這些性能優化能展現出更好的結果，這就是為什么我們要用一個double[]來測試它們。

[Params(1000)]
public?int?Length?{?get;?set;?}private?double[]?arr;[GlobalSetup]
public?void?GlobalSetup()
{var?random?=?new?Random();arr?=?Enumerable.Range(0,?Length).Select(_?=>?random.NextDouble()).ToArray();
}[Benchmark]
public?double?Average()?=>?arr.Average();[Benchmark]
public?double?Sum()?=>?arr.Sum();

結果顯示，性能顯著提高了 500%以上，而且同樣沒有了內存分配！

方法	數組長度	平均值	比率	分配
Average	1000	3,438.0 ns	5.50	32 B
Average	1000	630.3 ns	1.00	-

Sum	1000	3,303.8 ns	5.25	32 B
Sum	1000	629.3 ns	1.00	-

這里的性能提升并不像前面的例子那么突出，但還是非常高的!

3. Order

接下來是這是新增了兩個排序方法Order()和OrderDescending()。當你不想映射到IComparable類型時，應該使用新的方法取代.NET7 中舊的OrderBy()和OrderByDescending()方法。

[Params(1000)]
public?int?Length?{?get;?set;?}private?double[]?arr;[GlobalSetup]
public?void?GlobalSetup()
{var?random?=?new?Random();arr?=?Enumerable.Range(0,?Length).Select(_?=>?random.NextDouble()).ToArray();
}[Benchmark]
public?double[]?OrderBy()?=>?arr.OrderBy(d?=>?d).ToArray();#if?NET7_0
[Benchmark]
public?double[]?Order()?=>?arr.Order().ToArray();
#endif

方法	數組長度	平均值	風波無
OrderBy	1000	51.13 μs	27.61 KB
Order	1000	50.82 μs	19.77 KB

在這個基準中，只使用了.NET 7，因為Order()方法在舊的運行時中不可用。

我們無法看到這兩種方法之間的性能影響。然而，我們可以看到的是在堆內存分配方面有很大的改進，這將顯著減少垃圾收集，從而節省一些 GC 時間。

System.IO

在.NET 7 中，Windows 下的 IO 性能有了些許改善。WriteAllText()方法不再使用那么多分配的內存，ReadAllText()方法與.NET 6 相比也快了一些。

[Benchmark]
public?void?WriteAllText()?=>?File.WriteAllText(path1,?content);[Benchmark]
public?string?ReadAllText()?=>?File.ReadAllText(path2);

方法	平均值	比率	分配
WriteAllText	193.50 μs	1.03	10016 B
WriteAllText	187.32 μs	1.00	464 B

ReadAllText	23.29 μs	1.08	24248 B
ReadAllText	21.53 μs	1.00	24248 B

序列化 (System.Text.Json)

來自System.Text.Json命名空間的JsonSerializer得到了一個小小的升級，一些使用了反射的自定義處理程序會在幕后為你緩存，即使你初始化一個JsonSerialzierOptions的新實例。

private?JsonSerializerOptions?options?=?new?JsonSerializerOptions();
private?TestClass?instance?=?new?TestClass("Test");[Benchmark(Baseline?=?true)]
public?string?Default()?=>?JsonSerializer.Serialize(instance);[Benchmark]
public?string?CachedOptions()?=>?JsonSerializer.Serialize(instance,?options);[Benchmark]
public?string?NoCachedOptions()?=>?JsonSerializer.Serialize(instance,?new?JsonSerializerOptions());public?record?TestClass(string?Test);

在上面代碼中，對NoCachedOptions()的調用通常會導致JsonSerialzierOptions的額外實例化和一些自動生成的處理程序。在.NET 7 中這些實例是被緩存的，當你在代碼中使用這種方法時，你的性能會好一些。否則，無論如何都要緩存你的JsonSerialzierOptions，就像在CachedOptions例子中，你不會看到很大的提升。

方法	平均值	比率	分配	分配比率
Default	135.4 ns	1.04	208 B	3.71
CachedOptions	145.9 ns	1.12	208 B	3.71
NoCachedOptions	90,069.7 ns	691.89	7718 B	137.82
Default	130.2 ns	1.00	56 B	1.00
CachedOptions	129.8 ns	0.99	56 B	1.00
NoCachedOptions	533.8 ns	4.10	345 B	6.16

基本類型

1. Guid 相等比較

有一項改進，肯定會導致現代應用程序的性能大增，那就是對Guid相等比較的新實現。

private?Guid?guid0?=?Guid.Parse("18a2c952-2920-4750-844b-2007cb6fd42d");
private?Guid?guid1?=?Guid.Parse("18a2c952-2920-4750-844b-2007cb6fd42d");[Benchmark]
public?bool?GuidEquals()?=>?guid0?==?guid1;

方法	運行時	平均值	比率
GuidEquals		1.808 ns	1.49
GuidEquals		1.213 ns	1.00

可以感覺到，新的實現也使用了 SIMD，比舊的實現快 30%左右。

由于有大量的 API 使用Guid作為實體的標識符，這肯定會積極的產生影響。

2. BigInt 解析

一個很大的改進發生在將巨大的數字從字符串解析為BigInteger類型。就我個人而言，在一些區塊鏈項目中，我曾使用過BigInteger類型，在那里有必要使用這種類型來表示 ETH 代幣的精度。所以在性能方面，這對我來說會很方便。

private?string?bigIntString?=?string.Concat(Enumerable.Repeat("123456789",?100000));[Benchmark]
public?BigInteger?ParseBigInt()?=>?BigInteger.Parse(bigIntString);

方法	運行時	平均值	比率	分配
ParseBigInt		2.058 s	1.62	2.09 MB
ParseBigInt		1.268 s	1.00	2.47 MB

我們可以看到性能有了明顯的提高，不過我們也看到它比.NET6 上多分配一些內存。

3. Boolean 解析

對于解析boolean類型，我們也有顯著的性能改進：

[Benchmark]
public?bool?ParseBool()?=>?bool.TryParse("True",?out?_);

方法	運行時	平均值	比率
ParseBool		8.164 ns	5.21
ParseBool		1.590 ns	1.00

診斷

System.Diagnostics命名空間也進行了升級。進程處理有兩個重大改進，Stopwatch有一個新功能。

1. GetProcessByName

[Benchmark]
public?Process[]?GetProcessByName()=>?Process.GetProcessesByName("dotnet.exe");

方法	運行時	平均值	比率	分配	分配比率
GetProcessByName		2.065 ms	1.04	529.89 KB	247.31
GetProcessByName		1.989 ms	1.00	2.14 KB	1.00

新的GetProcessByName()的速度并不明顯，但使用的分配內存比前者少得多。

2. GetCurrentProcessName

[Benchmark]
public?string?GetCurrentProcessName()=>?Process.GetCurrentProcess().ProcessName;

方法	運行時	平均值	比率	分配	分配比率
GetCurrentProcessName		1,955.67 μs	103.02	3185 B	6.98
GetCurrentProcessName		18.98 μs	1.00	456 B	1.00

在這里，我們可以看到一個更有效的內存方法，對.NET 7 的實現有極高的性能提升。

3. Stopwatch

Stopwatch被廣泛用于測量運行時的性能。到目前為止，存在的問題是，使用Stopwatch需要分配堆內存。為了解決這個問題，dotnet 社區實現了一個靜態函數GetTimestamp()，它仍然需要一個復雜的邏輯來有效地獲得時間差。現在又實現了另一個靜態方法，名為GetElapsedTime()，在這里你可以傳遞之前的時間戳，并在不分配堆內存的情況下獲得經過的時間。

[Benchmark(Baseline?=?true)]
public?TimeSpan?OldStopwatch()
{Stopwatch?sw?=?Stopwatch.StartNew();return?sw.Elapsed;
}[Benchmark]
public?TimeSpan?NewStopwatch()
{long?timestamp?=?Stopwatch.GetTimestamp();return?Stopwatch.GetElapsedTime(timestamp);
}