ROCm
7件の記事 / ページ 1 / 1

MI100 vs RX 9700:ローカルLLM用途でどちらを選ぶべきか
ローカルLLM・Whisper・画像/動画生成を目的にGPU選定を検討しているユーザーの間で、AMD MI100とRX 9700の比較が話題になっている。ただしソース情報は極めて限定的であり、現時点で判断できる材料は乏しい。

Qwen3.5-122B量子化MTPモデル、ROCm環境でのベンチマーク結果が公開
観測。Qwen3.5-122BのQ5/Q6量子化MTPモデルをStrix Halo環境でROCm対応llama.cpp serverにて実測。Q5版は最大29.77 t/s、Q6版は最大25.10 t/sを記録。ローカル推論コミュニティに向けた実用的な速度指標として注目を集めている。

AMD MI300X上でCNC加工性検証マルチエージェントシステム「MachinaCheck」が登場
AMD MI300X GPUを基盤に、CNC製造の加工性検証をマルチエージェントAIで自動化する「MachinaCheck」が開発された。LabLab.ai主催のAMDデベロッパーハッカソン発のプロジェクトであり、製造業向けAI実装の新たな事例として注目される。その実態を冷静に見ていく。

ローカルLLMを本気でデイリードライブ:猛者がQwen 35b+27bを同時起動するOSSランチャー「Warpdrv」を公開
ローカルLLMを本気で日常使いしたい人へ朗報やで。RTX Pro 5000 BlackwellとStrix Haloを組み合わせた化け物マシンで、Qwen3.6の35bと27bを同時並走させるOSSランチャー「Warpdrv」がGitHubに公開された。個人開発なのにMCPやモデルルーターまで搭載という本気っぷりが話題を呼んでいる。

AMD「Halo Box」実機写真が流出——Ryzen AI Max+ 395搭載128GB統合メモリ機の正体
AMDのRyzen AI Max+ 395を搭載し、128GBの統合メモリを備えるデスクトップ筐体「Halo Box」の実機写真がRedditに投稿された。Ubuntu動作確認済みのデモ機であり、プログラマブルなLEDライトストリップも確認されている。ローカルLLM用途を狙った高帯域幅メモリ統合アーキテクチャの実態を冷静に検証する。

ROCm vs Vulkan、RX 6900 XTで実測:どちらが速いのか数字で見る
AMD Radeon RX 6900 XTを使い、llama.cppをROCm 6.4.2とVulkanの両バックエンドでビルドしてGemma 4およびQwen 3.5のベンチマークを実施したユーザー報告が公開された。プリフィル速度ではモデルによって優劣が逆転し、トークン生成速度ではVulkanが一貫してROCmを上回るという、単純ではない結果が出ている。

AMD RDNA向けLLM推論エンジン「hipfire」でHFQ4プリフィルが最大3.87倍高速化
AMD Strix Halo(gfx1151)上で動作するRDNA特化LLM推論エンジン「hipfire」に、MMQスタイルのプリフィル最適化パスが実験的に追加された。環境変数一つで有効化でき、Qwen3.5 9Bモデルでのプリフィルスループットが310〜340 tok/sから最大1260 tok/sへと跳ね上がる。