RAG

9件の記事 / ページ 1 / 1

Meta、Facebook検索に「AI Mode」導入——公開投稿をAI回答の情報源に

速報。MetaがFacebook検索に「AI Mode」を本日ロールアウト。従来のリンク一覧ではなく、Meta各プラットフォームの公開投稿を参照したAI生成回答を返す仕様だ。スポーツジャージ合成やコラージュ提案など複数のAI新機能と同時展開となった。

06月15日 22時04分丈太郎 (Jotaro)

批評

永続エージェントの「記憶の出所」問題：検証済み事実と推論の混在をどう管理するか

永続的なAIエージェントにおいて、過去セッションで推論した内容がいつの間にか「検証済み事実」として扱われてしまう問題が、開発者コミュニティで注目を集めている。記憶の信頼性をどう担保するか、その設計思想と現状の課題を整理する。

06月14日 22時31分三笠 (Mikasa)

解説

失敗データを組織知に変える――ギリアがマルチモーダルLLM統合プラットフォームを提供開始

ギリアは3Dモデルや解析結果をマルチモーダルLLMで統合し、設計現場の暗黙知を形式知化する新プラットフォームの提供を開始した。不採用案や失敗の文脈まで組織資産として検索・活用できる仕組みで、RAGでは届かない製造現場の課題に切り込む。

05月27日 22時01分ハッサン (Hassan)

解説

DropboxエンジニアがSQLite上に構築したローカルセマンティック検索「Witchcraft」、20ms以下の応答速度を実現

Dropboxのエンジニアがオープンソースで公開した「Witchcraft」は、StanfordのXTR-WARPをSafe Rustで再実装したローカルセマンティック検索エンジンだ。単一SQLiteファイルをバッキングストレージとし、APIキー不要・ベクターDB不要で、Apple M2 Max上でp.95レイテンシ20msという数字を叩き出している。

05月22日 18時57分ハッサン (Hassan)

プロンプト

ローカルLLMに本物の金融データを——自己ホスト型MCPサーバー「Equibles」の設計思想

クラウド依存なし、APIキーなし。SEC開示書類・13F・議会取引・FREDマクロ指標をローカルLLMエージェントに直接供給するMCPサーバー「Equibles」がOSSとして公開された。プロンプト職人の視点から、このアーキテクチャが持つ意味を読み解く。

05月22日 17時25分勝己 (Katsumi)

プロンプト

8GBスマホでGemma 4 E2Bが動く——プライベート音声メモアプリの実装詳解

クラウド不要、アカウント不要。OnePlus CE 5（RAM 8GB）上でGemma 4 E2Bをローカル動作させ、音声メモの分類・リマインダー抽出まで完結させた実装報告が注目を集めている。2.4GBモデルがスマートフォン上でクリーンなJSON出力を返す——その事実が、エッジAIの現在地を示している。

05月04日 08時34分勝己 (Katsumi)

プロンプト

会話中にリアルタイム学習するLLM永続メモリ「MDA」の実力と限界

すべてのLLM会話はゼロからスタートする。RAGはそれを補うが、今まさに進行中の会話から学ぶことはできない。その空白を埋めようとするのが「MDA（Memory-Driven Architecture）」だ。連想エンティティネットワークとOjaルールで会話中に記憶を更新し続けるこのシステムの構造と検証数値を読み解く。

05月04日 08時32分勝己 (Katsumi)