AMD は現地時間 2020/12/16 に、GPU を活用するコンピューティング、HPC、機械学習の開発者に向けた各種資料を公開するサイト ROCm™ Learning Center - AMD を開設した。
資料は動画と PDFファイル両方の形式で提供されている。
CDNA1 アーキテクチャ 採用 GPU AMD Instinct™ MI100 のリリース、それを正式にサポートすると同時に、ROCm ソフトウェアスタックとして HPC、機械学習を満たすソリューションとなる ROCm 4.0 のリリースが間近に迫っており、それに合わせてのものと見られる。
現在公開されている資料には、ROCm のインストール方法、HIP (Heterogeneous-Compute Interface for Portability ) の基本的なプログラミング、CUDAソースコードを HIP に変換する HIPIFY、ROCm を活用した機械学習、マルチGPUプログラミングとそのコミュニケーションライブラリの解説等がある。
ROCm はマルチGPUのコミュニケーションライブラリに、MPI (Maeesage Passing Interface) と RCCL (ROCm Communication Collectives Library) をサポートしている。
RCCL は NCCL (NVIDIA Collective Communications Library) API の機能が実装されており、NCCL を用いたコードは書き換えずにそのまま RCCL を使うことができる。
2つのライブラリの使い分けとして、RCCL は深層学習で多く使われる AllReduce
操作に対応しているため、学習では RCCL が向いているとし、
MPI は HPC は長年 HPCアプリケーションで用いられており、それらアプリケーションの保守性では優れていると説明されている。
マルチGPUシステムの例として、機械学習、物理シミュレーション、そして Bitcoinマイニングが挙げられていた。Bitcoinマイニングに高価な Instinct ブランドの GPU は合わないように思えるが、映像出力の無いマイニング向け Radeon カードの売りの 1つとして ROCm がサポートされていることがあったりするため、一応 AMD もターゲットとして見ているのだろう。1
2020/10 には Linux Kernel にブロックチェーン/マイニング向けの Navi10、Navi14 SKU のサポートが追加されている。
ブロックチェーン向けの Navi10 SKU とそこから読める文脈 | Coelacanth’s Dream
Navi14 にもブロックチェーン/マイニング向け SKU が追加される | Coelacanth’s Dream