Coelacanth's Dream

Navi12情報近況 (2020-03-09) & 推測

相変わらず実物が出てこない Navi12 。そうこうしている内に次世代GPU RDNA 2 の実シリコンが動作しているという話が出てきてしまった。(DXR 1.1の実行結果の画像1枚ではあるが)
しかしソフトウェア面ではちゃっかり出てきており、最新のLinux版Radeon Proドライバには Navi12 のファームウェア、そして amdgpu.ids に 7360:C1 が既に追加されている。
Radeon Pro Software for Enterprise 20.Q1.1 for Linux Release Notes | AMD
期待を捨てずに情報を追っていきたい。

より広範な混合演算に対応

Navi12 及び Navi14Arcturus は、Vega20 よりも広範なドット積の混合演算に対応する。
ドット積の混合演算は機械学習の推論高速化に用いられる。1

LLVMの記述に合わせて言えば、Vega20 では dot1-instsdot2-insts までの対応だったのが、
Navi12Navi14 では dot5-instsdot6-insts が、
Arcturus では dot3-instsdot4-instsdot5-instsdot6-insts の対応が追加された。
ここでの dot の後の数字はバージョンを表すと思われる。
llvm-project/AMDGPU.cpp at master · llvm/llvm-project

各々が含む命令は以下

  • dot1-insts * v_dot4_i32_i8 * v_dot8_i32_i4

引用元: llvm/AMDGPU.td at master · llvm-mirror/llvm

dot[3-6]-insts はエンコード先が追加されたものと読めるが、自信はあんまない
llvm-project/xdl-insts-gfx908.txt at master · llvm/llvm-project
llvm-project/xdl-insts-gfx1011-gfx1012.txt at master · llvm/llvm-project

Navi10 は上記命令には対応しておらず、そのためか Navi12 (gfx1011) は CLRX では NaviDL とされたりもしている。2
Vega20Navi14 でも対応していたのに Navi10 で見送ったのは開発時期によるものだろうか。

前の記事でも少し触れたネタ。

画像元: FINANCIAL ANALYST DAY 2020 - David Wang: Driving GPU Leadership

AMD RDNA Architecture

画像元: FINANCIAL ANALYST DAY 2020 - David Wang: Driving GPU Leadership

先日のFinancial Analyst Day 2020でAMDは、RDNAアーキテクチャの特徴を紹介していたが、その中でモバイルからクラウドゲーミングまで広い性能帯をカバーできるとしていた。
しかしRDNAアーキテクチャ、Navi10/12/14のどれかをベースにした製品でクラウドゲーミングサービスのサーバに採用された話は聞かない。
単に性能としては可能だ、という意味かもしれないが、投資家向けの発表で実現していないものを出すかは微妙だと思う。少なくともほぼ確実な事柄を持ち出すのではないだろうか。
そしてもし、Navi1xベースの製品がクラウドゲーミングに採用されるならば、SR-IOV(ゲスト)用のDeviceIDを持ち、対応が進められている Navi12 が最適なはずだ。
Google StadiaにGPUが採用された際のプレスリリースでも、SR-IOVに基づいたハードウェアベースの機能を強調している。
現状Google Stadiaは Radeon Pro WX 8200 とほぼ同等の性能を持つカスタムGPUでクラウドサーバを構築している。
GCNからRDNAで、電力効率が50%向上したことを考えれば Navi12 ベースのカスタムGPUに置き換える可能性は十分にある……はず。

以前だったら 2020-03-16 から開催予定のGDC2020で何かしらの発表を期待できたのだが、新型コロナウイルスの影響を受けて延期が決定されている。
3月開催予定だったゲーム開発者会議「GDC 2020」、新型コロナで今夏に延期 - ITmedia NEWS

Navi12の姿はまた遠く?

規模はNavi10と同一か

もう2ヶ月近く前の話だが、Navi12 (gfx1011)CompuBench実行結果が現れた。
それによると、Navi12 は 18WGP (36CU)、最大コアクロック 1144MHz、VRAM 8GBとされている。
1144MHzというのは以前Linux Kernelへのパッチで判明した、Peak(Game) Clock 1110MHzと近く、そこに不自然さはない。
[2/2] drm/amdgpu/smu: add peak profile support for navi12 - Patchwork
ネット上ではコアの仕様が Navi10 と同じでは Navi12 の存在意義は何か、ということで未だ確定していないVRAMがHBM2とする見向きがあるが、
力及ばず、その根拠となるパッチやソースコードは見つけることができなかった。

ただ上述の混合演算の対応を考えれば、Navi12 は Navi10リフレッシュ とまではいかないが Navi10改 のような存在だと考えられなくもない
競争力を取り戻すため Navi10 の開発を急ぎ、コンシューマ向けGPUには求められない一部新機能は見送り、必要とされるサーバ向け等ではそれより遅れて出す Navi12 でカバーする、としたの かもしれない。

ゲーミングMacに搭載か

AppleがゲーミングMacを発表するという があること、
ゲーミングMacが来年6月に最大55万円で発表されるかも!?
Navi12の予約されているIDの中に、Apple向けに用いられる傾向の RevisionID: 4x があることから、
Navi12はそれに搭載されるのではないか、という話がネット上では一定の支持を得てはいるが、噂に推測を重ねることは避けたいため、そういった話があることの紹介だけに留めたい。
散々妄想を垂れ流しておいてどの口が言うんだか……


参考: