AMD Financial Analyst Day 2020の気になった部分を、AMDのスライド、プレスリリースからまとめた。
Financial Analyst Day – 2020 | Advanced Micro Devices
AMD Details Strategy to Deliver Best-in-Class Growth and Strong Shareholder Returns at 2020 Financial Analyst Day | Advanced Micro Devices
使用したスライドを全て公開してくれているのは嬉しいが、それぞれのファイルで被っている内容も多く、頭の中の整理に少し手間取ってしまった。
Table Of Content
AMDの新パッケージング技術X3D

AMD Leadership Packaging
画像元: FINANCIAL ANALYST DAY 2020 - Mark Papermaster: Future of High Performance
AMDは今回、チップレット、ハイブリッド2.5D、ダイスタッキングを組み合わせ、帯域幅密度を10倍以上向上させたパッケージング技術、X3D を明らかにした。
IntelのEMIB、Foveros技術への対抗と思われ、
AMDは以前3D積層によってコンピュータを1つのパッケージに統合するビジョンを発表していたが、X3D はそれを実現に近づける技術とされる。1
CPU
2020年後期にZen 3 EPYC、Milan導入
Zen 3 アーキテクチャを採用する第3世代EPYC Milan は2020年後期に導入予定であり、続く Zen 4 アーキテクチャでは5nmプロセスを採用することを発表した。
AMD plans to introduce the first processors based on its next-generation “Zen 3” core in late 2020. The “Zen 4” core is currently in design and is targeted to use advanced 5nm process technology.

CPU RoadMap
画像元: FINANCIAL ANALYST DAY 2020 - Forrest Norrod: Data Center Leadership
Zen 3 のプロセスが7nmとされているが、これは Zen 2 で採用されたTSMC N7プロセスではなく、EUV露光技術を使用した TSMC N7+プロセス だと思われる。
N7+ ではN7と比べて、15%から20%上のトランジスタ密度を可能とし、消費電力も削減される。
N7+ is also providing improved overall performance. When compared to the N7 process, N7+ provides 15% to 20% more density and improved power consumption, making it an increasingly popular choice for the industry’s next-wave products.
引用元: TSMC’s N7+ Technology is First EUV Process Delivering Customer Products to Market in High Volume
Zen 4 の5nmはTSMC N5プロセスと考えられ、そちらはN7と比べて、80%上のトランジスタ密度、16%の高速化、30%の低消費電力化を実現する見込みとなっている。2
(追記 2020/03/07T13:20:40)しかし従来AMDが用いていた ‘7nm+’ という表記を使わなかったことは、必ずしもTSMC N7+を採用するとは限らないことを意味する、とAnandTechは指摘している。
AMD Clarifies Comments on 7nm / 7nm+ for Future Products: EUV Not Specified
そのため、N7プロセスを改良したN7Pプロセスを採用する可能性もある。
N7P はN7とデザインに互換性があるものの、EUV露光技術は使われない。
第4世代Ryzenも2020年中に登場
Zen 3 アーキテクチャ採用の第4世代Ryzenも2020年中に提供するとしている。
AMD is on track to bring increased performance to the gaming, content creation and productivity markets when it delivers the first “Zen 3”-based AMD Ryzen™ product in 2020.
しかし、アーキテクチャの具体的な改良点やプラットフォームに関しては今回明らかにされなかった。
GPU
コンピュート向け GPUアーキテクチャ、CDNA
今回新たに CDNA の名が出された。

Data Center GPU Road Map
画像元: FINANCIAL ANALYST DAY 2020 - Forrest Norrod: Data Center Leadership
まだ出てきていない、7nm (恐らく N7+)ということから CDNA は Arcturusを指し示していると思われる。
CDNA 2 がロードマップ上にあるが、採用プロセスは明らかにされていない。
時期を考えれば Zen4 同様に5nmプロセスを採用しそうだが、そう記されていないのは設計がまだ完了していないためか。
ひどく個人的な話だが、CDNAという名前には少し思う所がある。
RDNA が Radeon DNA の略なのに、CDNA は Compute DNA の略だ。
AMD unveiled its new AMD Compute DNA (AMD CDNA) architecture, designed to accelerate data center compute workloads.
どうも格好がつかないというか、Radeon に対して Compute では寂しいというか、GCN の格好よさを受け継いで欲しかったというか。
3つ目に関しては、GCN が Graphic Core Next の略で、Arcturus /CDNA はグラフィック処理をするためのユニットを持たず、GPGPU偏重のアーキテクチャとされるため、仕方がないと言えば仕方ないが。
Arcturusでは長く、MI100では製品的過ぎたが、CDNA は呼びやすく、その点では好き。
8 GPU構成、CPUとGPUのメモリ空間統合を可能へ

3rd Gen AMD Infinity Architecture
画像元: FINANCIAL ANALYST DAY 2020 - Mark Papermaster: Future of High Performance
3rd Genでは最大8GPUのコヒーレント接続に対応するとされ、いつかの妄想話3がかすっていたようで嬉しい限りだ。
ただ CDNA は8GPUに対応するが、CPUとGPUのメモリ空間の統合に対応せず、2nd Gen Infinity Architectureとされ、
8GPUが可能な上でCPUとGPUのメモリ空間統合が為された 3rd Gen Inifinity Architecture は CDNA 2 からとなる。

Unlocking Accelerated Computing
画像元: FINANCIAL ANALYST DAY 2020 - Forrest Norrod: Data Center Leadership
図を鵜呑みするならば、1st Genと2nd GenのようにPCI ExpressでCPUにそれぞれのGPUを接続するのではなく、Infinity FabricでCPUと8GPUのクラスタに接続するのだろうか。
図がひどく複雑になるため簡略化している可能性もある。
そしてGPUネットワークをよく見るとわかるが、あるGPUの対角に位置するGPUには線がない。(これも簡略されてる可能性があるが)

3rd Gen AMD Infinity Architecture - GPU Network
対角のGPUには繋がれていない。
画像元: FINANCIAL ANALYST DAY 2020 - Forrest Norrod: Data Center Leadership
しかしArcturus関連のコードから、ArcturusにはXGMIに最適化されたSDMAエンジンは8基ある。3
そしてGPUネットワークの繋がれた線は、隣のGPUとそれより離れたGPUとで太さが違う。
そこで、隣の2GPUとはそれぞれ2リンク、それより離れた4GPUとはそれぞれ1リンクとすれば、合計リンク数がSDMAエンジンの数 8基と一致する。
恐らくそういったネットワーク設計になっているのではないかと予想する。
大間違い。XGMIに最適化されたSDMAエンジンは6基だった。4
使用するSDMAエンジン数はどのGPUに対しても変わらない可能性のが高い。
というかSDMAエンジン数=リンク数のように書いてたが、リンク数はまた別の話だ。間抜けなシーラカンス……
Vega20 は複数GPUのコヒーレント接続でリングバスを構築していたが、8GPUの場合でもベースとしてそれを残すのだろうか。
(追記 2020/03/06T19:06:04)こういったネットワークを コーダルリング (Chordal Ring) と呼ぶらしい。
https://twitter.com/kato_kats/status/1235694954971717632
https://twitter.com/chiakokhua/status/1235694201150439424
気になるのは時期と8GPUシステムが採用されるかどうかで、AMDが納入する予定の次世代Exascaleスパコン、Frontier と El Capitan はどちらもノードあたり GPU 4 : CPU 1 の設計とされている。
New approach using accelerator-centric compute blades (in a 4:1 GPU to CPU ratio, connected by the 3rd Gen AMD Infinity Architecture for high-bandwidth, low latency connections) to increase performance for data-intensive AI, machine learning and analytics needs by offloading processing from the CPU to the GPU.
Frontier は2021年納入予定であり、調整の時間を考えると CDNA を、
El Captitan は2022年か2023年早期に納入予定、そして 3rd Gen Infinity Architecture に対応することから、CDNA 2 をGPUに採用するとされる。
別段スパコンだけがGPGPUを使う訳ではなく、データセンターや別のスパコンでも採用されるはずだが、それらスパコンが GPU 4 : CPU 1となると、今の段階では GPU 8 : CPU 1 の設計の採用予定は無いのかもしれない。
ボード開発や、8GPUに対応したブリッジに課題が残っている可能性もある。8GPUもの規模になるとIntelがXe-HPCを16基搭載する Ponte Vecchio の構想で示したように、GPUをPCIeカードに収めるのではなく、ボード上に8GPUを搭載する形のが良いだろう。5
AMDが今回、パッケージング技術 X3D を発表したのは、その布石かもしれない。もしかしなくてもIntel、AMDで近い形になるか。
そして、3rd Gen Infinity Architecture により、CPU-GPU間の帯域はPCIe Gen4の倍近くまで向上する。

AMD 3rd Gen Infinity Architecture Enables Accelerated Computing
画像元: FINANCIAL ANALYST DAY 2020 - Mark Papermaster: Future of High Performance
倍近くということから、PCIe Gen5を想定している可能性がある。
また、CPUとGPUのメモリ統合による、従来あったアドレス変換のオーバヘッドの削減も効果しているはずだ。
2020年後期にRDNA 2ベースGPUを発売予定

Gaming GPU RoadMap
画像元: FINANCIAL ANALYST DAY 2020 - Rick Bergman: Driving Growth Across PCs and Gaming
RDNA 2 の製品情報までは出なかったが、RDNAからの進化点は明らかにされた。
RDNA は GCN との比較で電力効率が50%向上したが、RDNA 2 ではそのさらに50%の向上が達成されるとする。
RDNA 2 も N7+ で生産されると思われるが、電力効率の向上はプロセス技術の進化だけではなく、マイクロアーキテクチャの改良、物理設計の最適化で実現するとしている。

AMD RDNA 2 Perf/Watt Improve
画像元: FINANCIAL ANALYST DAY 2020 - David Wang: Driving GPU Leadership
また、Ray Tracing と Variable Rate Shading の対応も明言されたが、それらはXbox Series X、PS5からの情報で既に明らかになっていたため、そこまでの驚きはないかもしれない。
性能面でも妥協のない4Kゲーミングをもたらす、とAMDは述べており、
相変わらず出てこない Navi12 では Navi10 以上のゲーミング性能を目標とせず、
Navi10 のターゲットであった1440Pより上の4Kは RDNA2 で果たす、ということと思われる。
しかし、今回の発表の中でRDNAアーキテクチャの特徴に、モバイルからクラウドゲーミングまでカバーするスケーラブルな構成であることがあげられた。

AMD RDNA Architecture
画像元: FINANCIAL ANALYST DAY 2020 - David Wang: Driving GPU Leadership
Navi12はRDNA世代では唯一SR-IOV (MxGPU)用のDevice IDが用意されており、その機能が強化されている。
そのことと合わせると、昨今広まりつつあるクラウドゲーミング向けのGPUとして Navi12 が出てくる可能性も十分にある。
RDNA 2 の動作デモはなかったが、実シリコンにて DXR 1.1 を実行した際のスクリーンショットは公開された。
そしてAMDは2020年後期に最初のRDNA 2 ベースの製品を発売する予定にある。
The first AMD RDNA 2-based products are expected to launch in late 2020.
RDNA 3
RDNA 3 もロードマップ上に姿を現したが、CDNA 2 同様に Advanced Node とされ、具体的なプロセスは明らかにされなかった。