Software

LLVM に旧世代の AMD GPU に向けた GPUID が追加される

AMD GPU のコンパイラバックエンドとして用いられる LLVM に、現行よりも二世代から四世代前の GPUID を一部整理するためのパッチが投稿された。製品が出た年で言えば、 ...

ACOバックエンドでも NGG をサポートする動き

Mesa3Dに、RADV(Vulkan) ドライバーの ACOバックエンド においても NGG(Next Generation Geometory) をサポート、そしてデフォルトで有効にするマージリクエストが ...

【XDC2020】AMD GPU のメモリ暗号化機能 TMZ ―― DRMへの活用も

XDC2020 にて、AMD GPU のドライバーに実装されている TMZ(Trust Memory Zone) 機能について、AMD の Ray Huang 氏が講演を行なった。 XDC 2020 – Day 1 – September 16, 2020 – YouTube X.Org Developers Conference 2020 (16-18 September 2020): Secure Buffer Object Support with Trusted ...

AMD GPU の世代における FMA、MAD 命令の微妙な仕様と違い

最近 Mesa3D に組み込まれた変更の中に以下のようなコメントがあった。 /* gfx6-8: use MAD (FMA is 4x slower) * gfx9-10: either is OK (MAD and FMA have the same performance) * gfx10.3: use FMA (MAD doesn't exist, separate MUL+ADD are 2x slower) * * FMA has no advantage on gfx9-10 and MAD ...

AMD、ROCm v3.7.0 をリリース & 今後のリリース予定

AMD は 大規模GPUコンピューティングのオープンソースプラットフォーム ROCm の ver3.7.0 をリリースした。 RadeonOpenCompute/ROCm at roc-3.7.x Ubuntu 20.04 をサポートし、 マルチスレッドによる並列プログラ ...

AMD、ROCm v3.5.1 をリリース & 問題への対処法

AMD は一部問題の修正と機能追加を施した ROCm v3.5.1 をリリースした。 RadeonOpenCompute/ROCm at roc-3.5.1 自環境でも早速アップデートしてみたが、OpenCLの実行で新たに問題が発生した。 そ ...

AMD、ROCm v3.5 をリリース

ユーザーはレポジトリからダウンロード、インストールが可能となっている。 Linuxディストリごとのインストール方法は以下から。 AMD ROCm Installation Guide v3.5.0 — ROCm Documentation 1.0.0 documentation ...

RadeonSI が Trust Memory Zone をサポート

AMD GPU向けのオープンソースOpenGLドライバー、RadeonSIが最新コミットで TMZ(Trust Memory Zone)機能をサポートした。 radeonsi: tmz support (!4401) · Merge Requests · Mesa / mesa · GitLab ...

RADV/ACO検証: ncnn Benchmark

おまけ的な記事。 これまで waifu2x-ncnn-vulkan を検証に用いてきたが、そのフレームワークである ncnn はビルド時にライブラリだけでなく、ベンチマークのバイナリも生成される。 ...

RADV/ACO 検証: ACOの高速シェーダーコンパイル

インデックス ACO のシェーダーコンパイル速度検証 環境 計測方法 結果 推測 やはり ACO は優秀 ACO のシェーダーコンパイル速度検証 前回の検証で ACOバックエンド は Vulakn ...

ROCm v3.4 は Arcturus への最適化がメインか

Tensileへのプルリクエストから ROCm v3.4 での更新内容が見えてきた。 Tensileとは、行列演算やN次元のテンソルの縮約、2つの多次元オブジェクト ...