Coelacanth's Dream

LLVM に Navi21/GFX1030 へ向けたパッチが投稿される

AMDGPU のコンパイラバックエンドとしても用いられる LLVM に、Navi21/gfx1030 のサポートに向けたパッチが投稿された。
[AMDGPU] Add gfx1030 target · llvm/llvm-project@9ee272f

今回追加されたコードは LLVM 11 に取り込まれるとされ1、その LLVM 11 はリリースサイクルから 2020/09 頃に来るはずだ。

Navi21/gfx1030 が対応する機能には、Navi12/gfx1011Navi14/gfx1012 の範囲に加えて、FeatureGFX10_3InstsFeatureGFX10_BEncoding が追加される。
後者は新たな命令エンコードのフォーマットとされるが、前者の概要はまだ明らかになっていない。2
また、Navi1x であったバグ等が修正されている。
Arcturus で追加された一部ドット積の混合演算には対応しなかった。 (FeatureDot3InstsFeatureDot4Insts)
そして、HalfRate64OpsFeatureSRAMECC にも対応していないことから、大方察しが付いているように Navi21Navi1x 同様にゲーミング向けのGPUだろう。今後それらに対応した RDNAアーキテクチャ GPUが出てくることはあるのだろうか? 完全に GCNアーキテクチャが担当することに?

他には、image_msaa_load 命令が追加されている。3
グラフィクス系の命令と考えられ、うまく読め解けないため推測となるが、MSAA処理を施したデータをどのレベルでコヒーレントを取るか指定できるようになっている? (SLC = System Level Coherent, GLC = Globally Coherent)

以前、OpenGL/Vulkan ドライバーに追加されたコードと同様に、SIMD32ユニットあたりの Wave数が 16エントリとなることを示すコードも追加されている。4
AMD Sienna Cichlid をサポートするパッチが OpenGL、Vulkanドライバーに投稿される | Coelacanth’s Dream その時に、AMD Polaris系 も SIMD16ユニットあたり 8エントリとなっていると書いたが、LLVM のコードにはそういった記述は見つけられなかった。
グラフィクス系処理のみに向けた最適化の一環だったりするのだろうか?

参考リンク