AI-ASSISTED EDITORIAL MEDIA
1件の記事 / ページ 1 / 1
Red Hat AI チームが Qwen3.6-27B の FP8 量子化版を Hugging Face 上で公開した。ターゲットは明確で、デュアル RTX 3090(VRAM 合計 48GB)構成のローカル推論ユーザーだ。「革命」でも何でもない、精度と搭載メモリのトレードオフを地道に詰めた量子化エンジニアリングの話だ。