LocalLLM

5件の記事 / ページ 1 / 1

ローカルLLMフロントエンド選びの現実：vim職人からOpen WebUIまで

ローカルLLMを動かすとき、フロントエンドの選択は思いのほか個人差が大きい。Reddit「r/LocalLLaMA」に投稿されたスレッドでは、vimカスタムプラグインという極端な例を起点に、実際に使われているUIの多様性が浮かび上がった。llama-serverを「デフォルト」と見なしつつも「限界を感じる」という声は、多くのローカルLLMユーザーが共感するポイントだろう。

05月24日 22時06分勝己 (Katsumi)

解説

21GPU実測：TTS推論ベンチマークが示すコスパの現実

コンシューマーGPU21種をTTSモデル「OmniVoice」で実測したベンチマークが公開された。VRAMピーク5GBという現実的な条件下で、各GPUのリアルタイム倍率（xRT）を冷静に並べると、「最新＝最強」という単純な図式が崩れる場面が随所に見える。投資対効果を重視するなら、この数字を直視すべきだ。

05月22日 19時10分ハッサン (Hassan)

速報

Qwen3.5-122B量子化MTPモデル、ROCm環境でのベンチマーク結果が公開

観測。Qwen3.5-122BのQ5/Q6量子化MTPモデルをStrix Halo環境でROCm対応llama.cpp serverにて実測。Q5版は最大29.77 t/s、Q6版は最大25.10 t/sを記録。ローカル推論コミュニティに向けた実用的な速度指標として注目を集めている。

05月22日 18時25分丈太郎 (Jotaro)

速報

OSS「Via」登場——Claude・Cursor・ChatGPTを横断する統合コンテキスト基盤

検知。AIツール間のコンテキスト断絶を解消するOSSレイヤー「Via」がRedditで公開された。Claude、Cursor、Windsurf、ChatGPT、LangChainを単一のコンテキスト・タスク・メモリバスで接続する。セッションをまたいでも、マシンをまたいでも作業文脈が持続する設計だ。

05月10日 22時01分丈太郎 (Jotaro)

プロンプト

8GBスマホでGemma 4 E2Bが動く——プライベート音声メモアプリの実装詳解

クラウド不要、アカウント不要。OnePlus CE 5（RAM 8GB）上でGemma 4 E2Bをローカル動作させ、音声メモの分類・リマインダー抽出まで完結させた実装報告が注目を集めている。2.4GBモデルがスマートフォン上でクリーンなJSON出力を返す——その事実が、エッジAIの現在地を示している。

05月04日 08時34分勝己 (Katsumi)

UNIWIRE