記事一覧
195件の記事 / ページ 1 / 8

コンテキスト圧縮、6つのAIエージェントは何を守り何を捨てるか
長いコンテキストをどう圧縮するか。Claude Code、Codex CLI、Cursor、Clineなど主要6エージェントの戦略を比較すると、「階層的プログレッシブ圧縮」への収束という共通点と、何を保護するかという根本的な相違点が浮かび上がる。

ChatGPT最大の刷新を率いるOpenAIエンジニア、Thibault Sottiaux とは何者か
速報。OpenAIのAIコーディング事業を急成長させたエンジニア、Thibault Sottiaux(ティボー・ソティオー)が、ChatGPT史上最大規模の刷新を指揮している。Wiredが2026年6月11日に報じた。

陰謀論にハマる数年前から言葉遣いに兆候、機械学習で判明
陰謀論コミュニティへの関与以前から、ユーザーの言語パターンに特徴的な変化が現れているという研究結果が発表された。機械学習モデルを用いた分析により、陰謀論とは無関係な文脈での発言にも、関与前から識別可能な言語的傾向が存在することが示唆されている。

AIアシスタントに頼りすぎて大丈夫?便利さと自立心のあいだで揺れる本音
「AIに何でも聞けば解決する」時代が来ているのに、なぜか素直に喜べない——そんな複雑な気持ち、あなたにもありませんか。パーソナルAIアシスタントへの期待と、それに依存することへの不安。この二つの感情を正直に見つめた視点を紹介します。

AppleがWWDCで見せた「AI一辺倒ではない」ソフトウェア改善の姿勢
2026年のWWDCでAppleは、AI強化版Siriを発表する前に、バグ修正・パフォーマンス向上・長年要望されてきた機能追加を丁寧に紹介しました。「AIだけが主役ではない」というメッセージを込めた今回の発表、その意味を一緒に読み解いていきましょう。

製造業のAIエージェント活用実態調査2026、現場のリアルな声とは
MONOist編集部が実施した「製造業のAIエージェント活用実態調査2026」の概要が公開された。製造業においてAIエージェントの導入・活用がどこまで進んでいるのか、現場の実態と課題感を把握したい読者に向け、調査結果のポイントを整理する。

SNS疲れのML研究者が探す「本当に使えるAIニュース源」とは
「ArXiv以外に、機械学習の良質な情報をまとめて読める場所はないの?」そんな疑問を持つ人は、実はとても多いんです。SNSのノイズやボットに疲れた研究者・学習者が、信頼できる情報源を求めて声を上げています。今回はその背景と、情報収集のヒントをお伝えします。

OpenAI、Lockdown Mode発表——プロンプトインジェクション攻撃から機密データを保護
速報。OpenAIがLockdown Modeを公開した。プロンプトインジェクション攻撃による機密データ漏洩リスクを低減する新機能だ。完全な防御は保証されないが、攻撃成功の可能性を下げることを目的としている。詳細は[TechCrunch](https://techcrunch.com/2026/06/06/openai-unveils-lockdown-mode-to-protect-sensitive-data-from-prompt-injection-attacks/)が報じた。

TechCrunch Disrupt 2026「Startup Battlefield 200」応募締切まで残り3日
TechCrunch主催のスタートアップピッチコンペティション「Startup Battlefield 200」の応募締切が、日本時間2026年6月9日(太平洋時間6月8日深夜11時59分)に迫っている。10月にサンフランシスコのMoscone Westで開催されるTechCrunch Disrupt 2026のメインステージを目指すスタートアップにとって、残された時間はわずかだ。

メルカリに学ぶAIガバナンス——「AI戦国時代」を生き抜く企業の勘所
生成AIの業務利用が当たり前となった今、企業はビジネス価値の創出と「シャドーAI」などのリスク管理を同時に求められている。「AI-Native Company」への転換を宣言したメルカリの取り組みから、AIガバナンス策定の実践的ヒントを探る。

学部1年でICMLワークショップに採択、参加すべき? 初めての学会を最大限に活かす方法
大学1年生が初めての筆頭著者論文をICMLワークショップに採択された体験談がRedditで話題になっています。費用や一人参加への不安を抱えながらも「行くべきか」と問うその投稿から、初めての国際学会参加をどう活かすかを考えてみます。

Claude Opus 4.8が示す「正直すぎるAI」の光と影——忖度しない設計の評価が分かれる理由
Anthropicが提供するClaude Opus 4.8は、性能向上に加えて「正直さ」の改善を大きな特徴として打ち出している。ユーザーの期待に迎合せず、事実を率直に伝える設計は一部から高く評価される一方、使い勝手の面では賛否が分かれているとも報告されている。本稿では、その背景と論点を整理する。

Qwen3.5-9BはGemma-4-12Bより小さいのに強い?ベンチマーク比較を解説
「Gemmaって話題だけど、実際どうなの?」と思っている方へ。海外コミュニティで注目されている比較検証によると、より小さいモデルであるQwen3.5-9BがGemma-4-12Bを8つ中5つのベンチマークで上回ったという結果が報告されています。今回はその中身をわかりやすく解説します。

RTX 4090とMacBook M4 Proを束ねてローカルLLMを動かせるか?現実的な検証
デスクトップPC(RTX 4090・24GB VRAM)とMacBook Pro(M4 Pro・48GBメモリ)を組み合わせ、ローカルLLM推論に使えるか。USB-C/USB4経由の異種OS間分散推論の可能性と限界を、実測データをもとに整理する。

「ベイズ統計」って何?Pythonで学ぶ入門編をやさしく解説
「ベイズ統計」という言葉を聞いたことはあるけれど、何のことかよくわからない、という方は多いと思います。今回は、Pythonを使ってベイズ統計の考え方を初歩から学べる入門記事をもとに、その基本的な流れをできるだけわかりやすくお伝えします。

フロリダ州、OpenAIとサム・アルトマンを提訴——暴力事件との関連を問う初の訴訟
フロリダ州が、OpenAIおよびCEOのサム・アルトマン氏を対象とした訴訟を提起した。同州立大学での銃撃事件にChatGPTが関与したと主張するもので、AIサービスを暴力事件と直接結びつけた訴訟としては初のケースとして注目されている。

「ハーネス」って何? Hugging FaceがAIエージェント用語の混乱を整理
「ハーネス」「スキャフォールド」……AIエージェントの話題で飛び交うこれらの言葉、人によって使い方がバラバラで混乱していませんか? Hugging Faceがこの状況を整理しました。初心者でも迷わないよう、基本用語をひとつひとつ丁寧に解説します。

エリン・ブロコビッチ、データセンターの「秘密主義」に照準を当てる
環境活動家エリン・ブロコビッチが新たなミッションとして、データセンターの情報開示問題に取り組み始めた。AI・クラウドインフラの急拡大を背景に、地域コミュニティへの環境影響を巡る透明性要求が高まっている。

ブラウザ上でPython ASGIアプリを動かす:Service Worker+Pyodideの新手法
PyodideとService Workerを組み合わせ、ブラウザ上でPython ASGIアプリをネイティブに近い形で動作させる手法が登場した。従来のWeb Worker方式が抱えていたJavaScript非実行の制約を克服し、Datasette Liteの本格的なアップグレードへの道が開かれようとしている。

バイブコーダーへの報復:プロンプトインジェクションでデータ消去を仕込んだ開発者の事件
「バイブコーディング」に嫌気が差した開発者が、他者のコードにデータ消去を引き起こすプロンプトインジェクションを密かに埋め込んだとされる事件が話題を呼んでいる。AIコード生成への過信がセキュリティリスクに直結することを示す、象徴的な出来事だ。

TXT・Markdown・HTML——出力形式でLLMの品質はどう変わるか
プロンプトで指定する出力形式がLLMの品質・速度・トークン数に与える影響を、Qwen3.6 35B A3Bを使った実測データで比較した投稿が話題だ。Markdownが品質スコア78/100で首位。HTMLはトークン爆発と品質低下を招く結果となった。

AIエージェントも「老化」する——AgingBenchが示すモデル交換の落とし穴
長期運用されたAIエージェントは、より高性能なモデルへ切り替えるだけでは性能が向上しないどころか、むしろ低下する可能性があることを示す研究が公開された。AgingBenchと呼ばれる縦断的ベンチマークの知見は、「新モデルに差し替えれば改善する」という直感的な前提を根本から問い直すものと考えられる。

SnowflakeがAWSと$6Bの5年契約——NvidiaへのAIチップ依存に変化の兆し
データクラウド大手のSnowflakeが、AI用CPUチップ調達を目的としてAmazon Web Services(AWS)と総額$60億(約9兆円)規模の5年間契約を締結した。Nvidiaが独占してきたAIチップ市場に対し、クラウド大手が独自路線を強める動きとして注目される。

失敗データを組織知に変える――ギリアがマルチモーダルLLM統合プラットフォームを提供開始
ギリアは3Dモデルや解析結果をマルチモーダルLLMで統合し、設計現場の暗黙知を形式知化する新プラットフォームの提供を開始した。不採用案や失敗の文脈まで組織資産として検索・活用できる仕組みで、RAGでは届かない製造現場の課題に切り込む。

週3.25億DLの「Starlette」に重大脆弱性——数百万のAIエージェントが危機
検知。オープンソースパッケージ「Starlette」に「BadHost」と命名された重大脆弱性が発見された。週間ダウンロード数は3億2500万件。多数のAIエージェント基盤が影響を受ける可能性がある。