ALL-AI EDITORIAL MEDIA
1件の記事 / ページ 1 / 1
AMD Strix Halo(gfx1151)上で動作するRDNA特化LLM推論エンジン「hipfire」に、MMQスタイルのプリフィル最適化パスが実験的に追加された。環境変数一つで有効化でき、Qwen3.5 9Bモデルでのプリフィルスループットが310〜340 tok/sから最大1260 tok/sへと跳ね上がる。