Coelacanth's Dream

AMD CES 2022 個人的まとめ

CES 2022 に併せたライブストリーミングにて AMD より新たな CPU、GPU、APU が発表された。
発表内容すべてをまとめる気力はないため、一部を個人的な記録としてまとめる。内容すべてを知りたいときは各種ニュースサイトか公式発表を確認してほしい。以前にも書いたが、このサイトはあくまでもオタクの日記。

Index

Ryzen 5x25U /Pro 5x75U (Barcelo)

Barcelo APU をベースとする Ryzen 5x25U /Pro 5x75U が発表された。BareloCezanne と同じく CPU に Zen 3 、GPU に Vega (GFX9) を採用している。プロセスも同様に TSMC 7nm FinFet で製造され、パッケージも続いて FP6。
Renoir に対する Lucienne のように、電源管理機能等を改良したという情報はなく、GPU部の有効 CU 数と動作クロックは Cezanne ベースの Ryzen 5x00U と変わらない。
違いとしては CPU の Base Clock、Boost Clock のどちらか、あるいは両方が 0.1 GHz 向上したぐらいものとなっている。

Ryzen Pro 5x75U も SKU 3種が発表されたが、プロセッサ仕様はモデルナンバーが対応する非 Pro SKU と同じ。

Codename Core/Thread Base Clock (GHz) Boost Clock (GHz) GPU CU GPU Clock (GHz)
5825U Barcelo 8/16 2.0 4.5 8 2.0
5625U Barcelo 6/12 2.3 4.3 7 ?
5425U Barcelo 4/8 2.7 4.1 6 1.6
5800U Cezanne 8/16 1.9 4.4 8 2.0
5600U Cezanne 6/12 2.3 4.2 7 1.8
5600U Cezanne 4/8 2.6 4.0 6 1.6

Ryzen 6000U/H/HS/HX (Yellow Carp [Rembrandt])

TSMC 6nm FinFet プロセスで製造され、Zen 3+RDNA 2 を組み合わせた APU をベースとする Ryzen 6000U/H/HS/HX シリーズ が正式発表された。
Zen 3+ では電力管理機能が強化され、クロックの切り替えレイテンシ削減と新たな Deep Sleepステートにより、性能と電力効率が一緒に強化されているとする。
GPU部は RDNA 2 アーキテクチャ となっただけでなく、L2キャッシュと RB (RenderBackend) の規模は倍に、CU数は Renoir/Lucienne/Cezanne (Green Sardine) /Barcelo の 8基から 12基へと 1.5倍になった。1
補足すると、RB (Render Backend) あたり 8 ROP相当という意味での RB+ は APU だと Stoney RidgeRaven (Zen, Vega, 14nm) の世代から実装、有効化されていた。
そのため Pixel Rate は RB数同様のスケールとなっている。RDNA 2 アーキテクチャ の採用と併せて 4倍ということにはならない。
一部の AMD GPU で実装、有効化されている RB+ とは何か | Coelacanth’s Dream

単純な数値の比較ではあるが、Shader Processor と Pixel Rate において、Tiger Lake-UAlder Lake-P/M に搭載されている Intel Gen12 GT2 は最大で 768 SP、24 ROP相当であり、それら規模では今まで AMD APU より上だった。(実性能は動作クロックやドライバー、メモリ性能等が関わってくる)
Yellow Carp ではそれを追い抜き返した形となる。

iGPU Renoir /Lucienne
/Cezanne (Green Sardine) /Barcelo
Yellow Carp
(Rembrandt)
Gen12 GT1
(TGL-H /RKL-S /ADL-S)
Gen12 GT2
(TGL-U /ADL-P/M)
8 CU 6 WGP
(12 CU)
32 EU 96 EU
Shader Processor 512 SP 768 SP 256 SP 768 SP
Pixel Rate 16 32 8 24
GPU Cache L2 1024 KiB L2 2048 KiB 1920 KiB 3840 KiB

ダイサイズはプロセッサ仕様によると 210mm2 としており、Cezanne の約 180mm2 より大きくなっている。
CPU部は Zen 3 と電力管理機能を除いてほとんど同じとされているため、PCIe Gen4, USB4 に対応した I/O部、RDNA 2 アーキテクチャ の採用と同時に規模が大きくなった GPU部の影響と思われる。

Vega (GFX9) 世代の APU では、GPU部のモデル名が CU数をそのまま反映したものになっていたが、Ryzen 6000U/H/HS/HX では Radeon 660M (6 CU)Radeon 680M (12 CU) という名前が付けられている。
GPU部だけを見たときのラインラップがかなりすっきりとし、わかりやすくなったと感じるが、Radeon 660M は 1900MHz で統一されているのに対し、Radeon 680MRyzen 6980HS/HX のみ 2400MHz、それ以外が 2200MHz となっている。
とはいえ同じ Vega (GFX9) 世代であっても有効 CU 数、動作クロックがバラバラだったのと比べればずっとわかりやすい。

AV1デコードの有無

個人的なトピックだった、Yellow Carp (Rembrandt) のハードウェア AV1デコードの有無については、びみょうにはっきりしないところがある。
まず、半年近く前 (2021/07/14) に投稿されたパッチで、Yellow Carp がHWデコードをサポートするフォーマットの中に MPEG2, MPEG4, VC1, AV1 は無かった。
現時点で該当部分に変更はされていない。
他 RDNA 2 GPU とは対応コーデックが異なる Yellow Carp APU と Beige Goby GPU | Coelacanth’s Dream だが発表会中では、Ryzen 6000 シリーズ は AV1デコードに対応するとしていた。2
パッチで追加されたコード部は DRM API 経由で amdgpu_asic_query_video_codecs を実行したときに対応するフォーマットの情報を返すのに使われているが、User Mode Driver である Mesa3D ではその中で対応サイズの情報だけを使っていた。

少しだけ話がずれてしまうが、AMD のプロセッサ仕様ページが最近アップデートし、Intel ark に近い形式となった。コードネームやアーキテクチャ、ダイサイズ等の情報が追加され、同時に見やすくなったと感じる。
Ryzen 6000 シリーズ のページも既に公開されており、Rembrandt の名が確認できる。
対応ビデオフォーマットの情報もあるのだが、Ryzen 5 6600URyzen 7 6800U とでズレがあり、参考にしにくい。

どちらにも AV1デコードの表記が無いのだが、何故か対応サイズが 1080p までだったり、Ryzen 5 6600U には MPEG2, VC1 があったりと、公開直後である現時点ではやはり参考にできない。
一応、Mesa3D でも Beige Goby (Navi24)Yellow Carp (Rembrandt) は MPEG2, MPEG4, VC1 に対応しないとしている。CHIP_BEIGE_GOBYPIPE_VIDEO_FORMAT_MPEG4_AVC はそれぞれ enum で管理されている。3 4

    switch (param) {
    case PIPE_VIDEO_CAP_SUPPORTED:
       if (codec < PIPE_VIDEO_FORMAT_MPEG4_AVC &&
           sscreen->info.family >= CHIP_BEIGE_GOBY)
          return false;

そういう訳で Yellow Carp の AV1デコードについてはまだ少し判然としないところがある。

Radeon RX 6500 XT / RX 6400 (Beige Goby [Navi24])

新たな RDNA 2 dGPU Radeon RX 6500 XT / RX 6400 が発表された。
メモリバス幅、Infinity Cache の規模から Beige Goby (Navi24) をベースにしていると思われる。
RDNA 2 dGPU では最も小規模で、Ryzen 6000 シリーズ と同じく 6nmプロセスで製造されることが特徴に挙げられる。
RX 6400 は 1スロット、TBP (Total Board Power) 53W、WGP 6基 (CU 12基)、GDDR6 16Gbps 4GB、
RX 6500 は 2スロット、TBP 107W、WGP 8基 (CU 16基)、GDDR6 18Gbps 4GB となっている。
2つで TBP の差が大きいが、有効 WGP数以上に、Game Clock では 571 MHz、Boost Clock では 494 MHz の差が要因になっていると思われる。

上 2つのページでは、動画エンコードと AV1デコードには非対応とされており、これはパッチでの情報と一致する。
だが現時点で RX 6300M/6500M は AV1デコードに対応と表記されており、信頼しきれない部分がある。

1080p でのゲーム性能において、RX 570 (Polaris19, 14nm) より高速であることがアピールされている。
トランジスタ数が、Polaris10 は 5.7 B、Beige Goby (Navi24) は 5.4 B とされており、微細化によるトランジスタ密度向上、ユニット数の増加ではなく、同程度のトランジスタ数ながらアーキテクチャの進化と倍以上にもなる動作クロックの向上によって RX 6500 XTRX 570 以上の性能を達成している。
RX 6500 XT は GDDR6 18Gbps を採用しているが、メモリバス幅は 64-bit であり、RX 570 と比較してメモリ帯域は 64% 程度 (144 GB/s vs 224 GB/s) である。この点、Infinity Cache 16 MiB がかなり活きているように思う。
しかし、1080p より上の解像度や GPGPU 等においては 16 MiB ではカバーしきれず、最大 4GB というメモリサイズもあって、性能は低下すると考えられる。
RDNA 2 アーキテクチャ の中でも、ゲームに特化しているという特徴が濃く出ているようにも感じる。

RDNA 2 Sienna Cichlid
(Navi21)
Navy Flounder
(Navi22)
Dimgrey Cavefish
(Navi23)
Beige Goby
(Navi24)
Shader Engine 4 2 2 1 ?
WGP (CU) 40 (80) 20 (40) 16 (32) 8 (16) ?
RB+ 16 8 8 4
Memory Bus 256-bit 192-bit 128-bit 64-bit
Infinity Cache 128 MiB 96 MiB 32 MiB 16 MiB
Transistor 26.8 B 17.2 B 11.1 B 5.4 B

参考リンク