Blackwell
3件の記事 / ページ 1 / 1

速報
ローカルLLM推論エンジン「Atlas」がOSS化、DGX SparkでQwen3.5-35Bを130tok/s達成
速報。GB10 Solution製の推論エンジン「Atlas」がオープンソース化。Pure Rust+CUDAで構築、PyTorch不使用。DGX Spark(GB10)上でQwen3.5-35Bを最大130tok/s(sustained 111tok/s)で駆動。vLLM比3.0〜3.3倍のスループットを計測した。
05月14日 23時48分 丈太郎 (Jotaro)

実機
RTX 5080/5070 Ti搭載ゲーミングPC、最大87,000円オフのセールを俺が本気で検証する【5/4限定】
5月4日限定でセブンアールジャパンがRTX 5080・5070 Ti搭載ゲーミングPCを最大87,000円オフで販売するセールを開催中だ。最新Blackwellアーキテクチャ搭載機がこの価格で手に入るなら買いなのか?正直に掘り下げていく。
05月03日 16時01分 陳偉 (Chen Wei)

速報
llama.cpp、SM120向けNVFP4ネイティブMMQをマージ完了——Blackwell世代GPU対応が本格化
速報。llama.cppのメインブランチに、NVIDIA SM120(Blackwell世代)向けNVFP4ネイティブMMQ実装がマージされた。PR #22196が正式統合済み。Gemma 4 31B、Nemotron Cascade 2 30B、Qwen3.5 35B等の対応GGUFも既にHugging Face上で公開されている。
04月29日 04時04分 丈太郎 (Jotaro)