RAG
9件の記事 / ページ 1 / 1

Meta、Facebook検索に「AI Mode」導入——公開投稿をAI回答の情報源に
速報。MetaがFacebook検索に「AI Mode」を本日ロールアウト。従来のリンク一覧ではなく、Meta各プラットフォームの公開投稿を参照したAI生成回答を返す仕様だ。スポーツジャージ合成やコラージュ提案など複数のAI新機能と同時展開となった。

永続エージェントの「記憶の出所」問題:検証済み事実と推論の混在をどう管理するか
永続的なAIエージェントにおいて、過去セッションで推論した内容がいつの間にか「検証済み事実」として扱われてしまう問題が、開発者コミュニティで注目を集めている。記憶の信頼性をどう担保するか、その設計思想と現状の課題を整理する。

失敗データを組織知に変える――ギリアがマルチモーダルLLM統合プラットフォームを提供開始
ギリアは3Dモデルや解析結果をマルチモーダルLLMで統合し、設計現場の暗黙知を形式知化する新プラットフォームの提供を開始した。不採用案や失敗の文脈まで組織資産として検索・活用できる仕組みで、RAGでは届かない製造現場の課題に切り込む。

DropboxエンジニアがSQLite上に構築したローカルセマンティック検索「Witchcraft」、20ms以下の応答速度を実現
Dropboxのエンジニアがオープンソースで公開した「Witchcraft」は、StanfordのXTR-WARPをSafe Rustで再実装したローカルセマンティック検索エンジンだ。単一SQLiteファイルをバッキングストレージとし、APIキー不要・ベクターDB不要で、Apple M2 Max上でp.95レイテンシ20msという数字を叩き出している。

ローカルLLMに本物の金融データを——自己ホスト型MCPサーバー「Equibles」の設計思想
クラウド依存なし、APIキーなし。SEC開示書類・13F・議会取引・FREDマクロ指標をローカルLLMエージェントに直接供給するMCPサーバー「Equibles」がOSSとして公開された。プロンプト職人の視点から、このアーキテクチャが持つ意味を読み解く。

8GBスマホでGemma 4 E2Bが動く——プライベート音声メモアプリの実装詳解
クラウド不要、アカウント不要。OnePlus CE 5(RAM 8GB)上でGemma 4 E2Bをローカル動作させ、音声メモの分類・リマインダー抽出まで完結させた実装報告が注目を集めている。2.4GBモデルがスマートフォン上でクリーンなJSON出力を返す——その事実が、エッジAIの現在地を示している。

会話中にリアルタイム学習するLLM永続メモリ「MDA」の実力と限界
すべてのLLM会話はゼロからスタートする。RAGはそれを補うが、今まさに進行中の会話から学ぶことはできない。その空白を埋めようとするのが「MDA(Memory-Driven Architecture)」だ。連想エンティティネットワークとOjaルールで会話中に記憶を更新し続けるこのシステムの構造と検証数値を読み解く。

生成AI導入の10大リスクとは——推進担当者が知るべき全体像と実践的対策
経営層から生成AI全社展開を命じられた推進担当者にとって、情報漏洩・著作権侵害・誤情報拡散といったリスクの全体像を事前に把握しておくことは、導入後のトラブルを未然に防ぐ上で不可欠な準備と考えられる。本稿では、主要リスクの構造と対策の方向性を論点ごとに整理する。

「LLM出張サポート」が次の職業になる?ローカルAI普及が生む新ビジネス機会
ローカルLLM(大規模言語モデル)の家庭導入が進む中、「AIプランバー」とも呼ぶべき新職種の台頭を予測する声がAIコミュニティで広がっている。テクノロジーの民主化が新たなサービス市場を生み出す可能性について、シリコンバレーの現場から読み解く。