Coelacanth's Dream

AMD、GPGPU開発者向けの資料集 「ROCm Learning Center」を開設

AMD は現地時間 2020/12/16 に、GPU を活用するコンピューティング、HPC、機械学習の開発者に向けた各種資料を公開するサイト ROCm™ Learning Center - AMD を開設した。
資料は動画と PDFファイル両方の形式で提供されている。

CDNA1 アーキテクチャ 採用 GPU AMD Instinct™ MI100 のリリース、それを正式にサポートすると同時に、ROCm ソフトウェアスタックとして HPC、機械学習を満たすソリューションとなる ROCm 4.0 のリリースが間近に迫っており、それに合わせてのものと見られる。

現在公開されている資料には、ROCm のインストール方法、HIP (Heterogeneous-Compute Interface for Portability ) の基本的なプログラミング、CUDAソースコードを HIP に変換する HIPIFYROCm を活用した機械学習、マルチGPUプログラミングとそのコミュニケーションライブラリの解説等がある。

ROCm はマルチGPUのコミュニケーションライブラリに、MPI (Maeesage Passing Interface) と RCCL (ROCm Communication Collectives Library) をサポートしている。
RCCL は NCCL (NVIDIA Collective Communications Library) API の機能が実装されており、NCCL を用いたコードは書き換えずにそのまま RCCL を使うことができる。
2つのライブラリの使い分けとして、RCCL は深層学習で多く使われる AllReduce 操作に対応しているため、学習では RCCL が向いているとし、
MPI は HPC は長年 HPCアプリケーションで用いられており、それらアプリケーションの保守性では優れていると説明されている。

マルチGPUシステムの例として、機械学習、物理シミュレーション、そして Bitcoinマイニングが挙げられていた。Bitcoinマイニングに高価な Instinct ブランドの GPU は合わないように思えるが、映像出力の無いマイニング向け Radeon カードの売りの 1つとして ROCm がサポートされていることがあったりするため、一応 AMD もターゲットとして見ているのだろう。1
2020/10 には Linux Kernel にブロックチェーン/マイニング向けの Navi10Navi14 SKU のサポートが追加されている。
ブロックチェーン向けの Navi10 SKU とそこから読める文脈 | Coelacanth’s Dream Navi14 にもブロックチェーン/マイニング向け SKU が追加される | Coelacanth’s Dream