LLM
22件の記事 / ページ 1 / 1

コンテキスト圧縮、6つのAIエージェントは何を守り何を捨てるか
長いコンテキストをどう圧縮するか。Claude Code、Codex CLI、Cursor、Clineなど主要6エージェントの戦略を比較すると、「階層的プログレッシブ圧縮」への収束という共通点と、何を保護するかという根本的な相違点が浮かび上がる。

バイブコーダーへの報復:プロンプトインジェクションでデータ消去を仕込んだ開発者の事件
「バイブコーディング」に嫌気が差した開発者が、他者のコードにデータ消去を引き起こすプロンプトインジェクションを密かに埋め込んだとされる事件が話題を呼んでいる。AIコード生成への過信がセキュリティリスクに直結することを示す、象徴的な出来事だ。

AIエージェントも「老化」する——AgingBenchが示すモデル交換の落とし穴
長期運用されたAIエージェントは、より高性能なモデルへ切り替えるだけでは性能が向上しないどころか、むしろ低下する可能性があることを示す研究が公開された。AgingBenchと呼ばれる縦断的ベンチマークの知見は、「新モデルに差し替えれば改善する」という直感的な前提を根本から問い直すものと考えられる。

Qwen 3.7 オープンソース公開を待つコミュニティの声
観測。Alibaba の Qwen チームによる次世代モデル「Qwen 3.7」のオープンソース公開を巡り、LocalLLaMA コミュニティで待望論が噴出している。パラメータ規模への拘りより「まず公開してほしい」という声が象徴的だ。

AIエージェントの「なぜ」を可視化するOSS「Spice」——決定層という新概念
AIエージェントは「実行」が得意になった。だが「何をすべきか、なぜそれか」という上位の意思決定は依然として人間任せだ。その空白を埋めようとするOSSプロジェクト「Spice」が登場した。エージェントの推論境界を記録・可視化する「決定層」という設計思想を持つ。

MCPって結局何?ツール呼び出しとどう違うのか初心者向けに解説
「MCPって名前は聞くけど、ただのツール呼び出しと何が違うの?」そんな疑問を持つ人が増えています。難しそうに見えて、実は考え方自体はシンプルなんです。今回はMCPの基本的な概念を、初めて聞く人でもわかるように丁寧に解説します。

WebGLでリアルタイムに人間の顔を生成——ローカルAIが見せた驚きの実力
「ローカルで動くAIがWebGLのコードを書いて、リアルタイムにリアルな人間の顔を描画する」——そんな光景がRedditに投稿され、話題を集めています。使われたのはQwen3.5-122B-A10Bという大規模言語モデル。いったい何が起きているのか、初心者にもわかるように丁寧に解説します。

arXivがAI全自動論文に1年間の投稿禁止措置——研究倫理の新たな基準が問うもの
プレプリントサーバー「arXiv」が、大規模言語モデル(LLM)の不適切な利用に対して1年間の投稿禁止という制裁措置を導入した。科学論文における生成AIの「careless use(不注意な使用)」をどこまで許容するか、研究コミュニティ全体が問われている。

マスク対オルトマン裁判、最終弁論でOpenAI側が証拠の山で圧倒か
2026年5月14日、マスク氏対オルトマン氏の裁判における最終弁論が行われた。マスク側弁護士の失言や事実誤認が相次いだ一方、OpenAI側は時系列に沿った証拠の整理で反論したと報じられており、法廷の行方に注目が集まっている。

AMD MI300X上でCNC加工性検証マルチエージェントシステム「MachinaCheck」が登場
AMD MI300X GPUを基盤に、CNC製造の加工性検証をマルチエージェントAIで自動化する「MachinaCheck」が開発された。LabLab.ai主催のAMDデベロッパーハッカソン発のプロジェクトであり、製造業向けAI実装の新たな事例として注目される。その実態を冷静に見ていく。

会話中にリアルタイム学習するLLM永続メモリ「MDA」の実力と限界
すべてのLLM会話はゼロからスタートする。RAGはそれを補うが、今まさに進行中の会話から学ぶことはできない。その空白を埋めようとするのが「MDA(Memory-Driven Architecture)」だ。連想エンティティネットワークとOjaルールで会話中に記憶を更新し続けるこのシステムの構造と検証数値を読み解く。

生死の判断にLLMが介入する時代——軍事意思決定とAI倫理の交差点
大規模言語モデル(LLM)を基盤とする「助言AI」が、軍の攻撃目標選定プロセスに組み込まれつつある。シリコンバレーとペンタゴンの関係がかつてないほど緊密化するなか、AIが生死に関わる判断に関与することの倫理的・法的含意を、本稿では多角的に検討したい。

103Bトークン・33年分のUsenetコーパス、個人が独力で構築し公開
観測。1980年から2013年にわたる33年分のUsenetアーカイブを、個人開発者が数年かけて単独構築。総量103.1Bトークン、4億8百万投稿、18,347ニュースグループ。SEO最適化もAI生成コンテンツも存在しない時代の生の言語データが、HuggingFace上で公開された。

Karpathy自律研究フレームワーク、3300万トークンの公共交通データで14%改善を達成
観測。Andrej Karpathyのautoresearchフレームワークを、公共交通業界の専門コーパス(約3300万トークン)に適用した実験が報告された。設計目標より6桁小さいデータセットでも、パープレキシティ14%改善を達成。自律実験ループの汎用性を示す結果だ。

Zigの作者が語る「AIの匂い」:LLM生成コードは見抜けるという主張を検証する
プログラミング言語Zigの作者であるAndrew Kelley氏が、LLM(大規模言語モデル)を用いたコード貢献は経験者には識別可能であると主張した。この発言はオープンソースコミュニティにおけるAI利用ポリシーの是非をめぐる議論に新たな視点を加えるものと考えられる。

AIエンジニアに転職したい——ソフトウェア開発4年目が挑む「AI業界への入り方」
「AIの仕事がしたいけれど、どこから始めればいいの?」そんな疑問を持つ人は今、世界中にいます。ソフトウェア開発の経験を持ちながらもAI分野への転職を目指す声が相次ぐ中、実際に何を準備すれば道が開けるのか、一緒に整理してみましょう。

NVIDIAがAIエージェントでGPUカーネルを自動翻訳——cuTile Python→Julia変換の実態
NVIDIAはAIエージェントを用いてGPUカーネルコードをcuTile Python実装からJulia向けcuTile.jlへ自動翻訳する手法を公開した。タイルベースプログラミングモデルの多言語展開という戦略的意図は明確だが、その実用性と限界を冷静に検証する。

LLMはなぜ日本文化に「偏る」のか――欧州研究チームが明らかにした文化的バイアスの実態
スペインのバスク大学や英カーディフ大学などの研究者らが発表した論文が、一部の大規模言語モデル(LLM)が文化的トピックにおいて日本文化を過剰に参照する傾向を持つことを示した。GPT-4o miniなどのモデルが対象となっており、その偏りの構造と背景が詳細に分析されている。

ZigプロジェクトがLLM投稿を全面禁止する理由:「コントリビューター・ポーカー」という概念で読み解く
オープンソースのシステムプログラミング言語Zigは、イシュー・プルリクエスト・コメントのいずれにおいてもLLM(大規模言語モデル)生成コンテンツを禁止する、主要OSS プロジェクトの中でも際立って厳格なポリシーを採用している。その背景にある論理は何か。Zig Software Foundation VP of Community Loris Cro 氏の論考を中心に検証する。

生成AI導入の10大リスクとは——推進担当者が知るべき全体像と実践的対策
経営層から生成AI全社展開を命じられた推進担当者にとって、情報漏洩・著作権侵害・誤情報拡散といったリスクの全体像を事前に把握しておくことは、導入後のトラブルを未然に防ぐ上で不可欠な準備と考えられる。本稿では、主要リスクの構造と対策の方向性を論点ごとに整理する。

小さなAIが自分でゲームを作って自分でプレイ――ローカルLLMの「遊び心」が話題に
「AIって難しそう」と思っている人にこそ読んでほしいニュースです。インターネット上のAIコミュニティで、小さなローカルLLM(自分のパソコンで動かせるAIモデルのことです)が自分でゲームを作り、そのゲームを自分でプレイする様子が話題になっています。いったい何が起きているのか、一緒に見ていきましょう。

スマホがAIロボットに変身!「LOOI(ルーイ)」がMakuakeで700万円超えの支援を集める
深セン発のロボティクスメーカーTangibleFutureが開発したAIロボット「LOOI(ルーイ)」が、Makuakeで日本向け先行販売を開始。スマートフォンをドッキングするだけでAIロボットに変身するという斬新なコンセプトが話題を呼び、支援額は700万円を超えた。