.NET10 Preview5 が利用可能になりました。
今回は新機能のひとつ、ローカルのデリゲートをスタックに置く最適化 / Escape Analysis for Delegates を見てみます。
サンプルコード
テストコード
using System.Runtime.CompilerServices;
public class __EscapeAnalysisForDelegatesTest
{
static void Performance(Performance p)
{
p.AddTest("Delegate", () =>
{
int sum = 0;
for (int i = 0; i 100000; i++)
{
int local = i;
var func = (int x) => x + local;
sum += func(i);
}
});
p.AddTest("LocalMethod", () =>
{
int sum = 0;
for (int i = 0; i 100000; i++)
{
int local = i;
[MethodImpl(MethodImplOptions.NoInlining)]
int Func(int x) => x + local;
sum += Func(i);
}
});
p.AddTest("Inlining", () =>
{
int sum = 0;
for (int i = 0; i 100000; i++)
{
int local = i;
[MethodImpl(MethodImplOptions.AggressiveInlining)]
int Func(int x) => x + local;
sum += Func(i);
}
});
}
}
パフォーマンス
p.AddTest("Delegate", () =>
{
int sum = 0;
for (int i = 0; i 100000; i++)
{
int local = i;
var func = (int x) => x + local;
sum += func(i);
}
});
p.AddTest("LocalMethod", () =>
{
int sum = 0;
for (int i = 0; i 100000; i++)
{
int local = i;
[MethodImpl(MethodImplOptions.NoInlining)]
int Func(int x) => x + local;
sum += Func(i);
}
});
p.AddTest("Inlining", () =>
{
int sum = 0;
for (int i = 0; i 100000; i++)
{
int local = i;
[MethodImpl(MethodImplOptions.AggressiveInlining)]
int Func(int x) => x + local;
sum += Func(i);
}
});
Test | Score | % | GC0 |
---|---|---|---|
.NET10 x86 | |||
Delegate | 144 | 100.0% | 121 |
LocalMethod | 636 | 441.7% | 0 |
Inlining | 4,454 | 3,093.1% | 0 |
.NET9 x86 | |||
Delegate | 159 | 100.0% | 133 |
LocalMethod | 632 | 397.5% | 0 |
Inlining | 4,430 | 2,786.2% | 0 |
実行環境: Windows11 x64 .NET Runtime 10.0.0
Score は高いほどパフォーマンスがよいです。
GC0 はガベージコレクション回数を表します(少ないほどパフォーマンスがよい)。
- .NET10 は .NET9 と比較して GC 回数が減っています
- .NET10 は .NET9 と比較してパフォーマンスが少し悪くなっています。何回か計測しましたがこの傾向です
ローカル関数使うとよさそう
パフォーマンス結果から考えてみる
GC 回数が減ったのは今回の最適化によってデリゲートオブジェクトがスタックに置かれるようになったと思われます。GC が 0 になっていませんが、これはローカル変数キャプチャによるクロージャオブジェクトが作られるからですね。
参考:ローカル関数と匿名関数#ローカル変数の捕獲 https://ufcpp.net/study/csharp/functional/fun_localfunctions#capture-local
一方でパフォーマンスが微妙に下がっている理由は・・・よくわかりません。まだ preview 版ですし、ランタイム最適化が複雑で思いのほか解析コストがあるのかもしれません。
ローカル関数の方はいろいろ最適化がかかってパフォーマンスが出ます。インライン化もされます。
おわりに
自分の印象だと、今回の最適化は .NET10 で力を入れている クラスオブジェクトの Stack 配置
最適化の一部お披露目といった感じです(大掛かりな最適化の、できたところから順に公開してフィードバックを取り入れる)。ランタイムがかなり仕事をするので、様々な環境でバグなくパフォーマンスも上げるのはかなり根気のいる作業ですね・・・
関連
【C#】.NET10 Preview1 キタ━━(゚∀゚)━━!!
【C# .NET10 Preview1】値型の配列をスタックに作成する最適化の検証
【C# .NET10 Preview2】参照型がスタックに置かれる最適化
【C# .NET10 Preview3】null 条件付き代入
【C# .NET10 Preview3】参照型の小さな配列のスタック割り当て
【C# .NET10 Preview3】拡張メソッドの機能追加
【C# .NET10 Preview4】try-finally をインライン化する最適化の追加
【C# .NET10 Preview4】非同期 ZIP アーカイブ
Views: 0