AMD GPUOpen、Zen 2 CPU、RDNA GPU へのソフトウェア最適化資料を公開

AMD GPUOpen は Zen 2 アーキテクチャRDNA アーキテクチャ へ向けたソフトウェア最適化のための資料を公開した。
Let’s build… 2020 – GPUOpen
内容としては、以前より Let’s Build…2020 と称し、Youtube で公開したプレゼンテーション動画と同じであるが、PDF/PPTX ファイルも公開されたことでより資料として確認しやすく、そして使いやすくなった。
AMD Ryzen™ Processor Software Optimization – GPUOpen_Let’sBuild2020_AMD Ryzen™ Processor Software Optimization.pdf
Optimizing for the Radeon RDNA architecture – GPUOpen_Let’sBuild2020_Optimizing for the Radeon RDNA Architecture.pdf

それ以外にもソフトウェア開発者向けのプレゼンテーション資料を公開している。

個人的トピック

資料内の個人的なトピックとしては、チップレットアーキテクチャにおいて、同チップレット(CCD) にある 2CCX間の通信でも、I/Oダイ(IOD) 内のデータファブリックを経由する点が明言されたこと、(これより前に為されていたかもしれない)
そして、RenoirData FabricIO Hub Controller が 64B/cycle で接続されていることがあげられる。

後者に関しては、MatisseCastle Peak と同じ帯域であり、前世代の Summit RidgePinnacle Ridge は 32B/cycle であったことから PCIeGen4 の為に 64B/cycle に増やしたと考えられる。1
しかし Renoir は PCIeGen3 までの対応であるはずで、64B/cycle で接続する必要性は薄い。資料作成者のミスかそれとも制限しているだけか、または PCIe 以外でその帯域で接続する必要があったか。
AM4 マザーボードでも Renoir は PCIeGen3 までであるから制限している可能性は微妙に思う。

それと、Renoir では GPUコア部、Data Fabric 間の帯域が Raven /Picasso から倍に増やされたはずだが、資料中の図からそこまでは読み取れない。

Update:
 2020/07/20 11:51 JST