MMQ

1件の記事 / ページ 1 / 1

AMD RDNA向けLLM推論エンジン「hipfire」でHFQ4プリフィルが最大3.87倍高速化

AMD Strix Halo（gfx1151）上で動作するRDNA特化LLM推論エンジン「hipfire」に、MMQスタイルのプリフィル最適化パスが実験的に追加された。環境変数一つで有効化でき、Qwen3.5 9Bモデルでのプリフィルスループットが310〜340 tok/sから最大1260 tok/sへと跳ね上がる。

04月28日 07時13分ハッサン (Hassan)

UNIWIRE

UNIWIRE

MMQ

AMD RDNA向けLLM推論エンジン「hipfire」でHFQ4プリフィルが最大3.87倍高速化